Recolectar un corpus del espanol hablado en la comunidad de habla de Tunja, Boyaca, Colombia, es una investigacion de base para la comprension de los usos dialectales del espanol en el mundo hispanico. Este proyecto se enmarca dentro de los estudios sincronicos del habla y sejustifica en la necesidad de reconocer y explicar, de manera experimental, la estructura y funcionamiento sociolinguistico del espanol hablado en Colombia en general, y de Tunja en particular. La investigacion tiene como finalidad recolectar un corpus del habla de Tunja, Boyaca, y caracterizar la comunidad de habla que sirvan de material de estudio para analizar los usos dialectales del espanol en sus variaciones sociofonicas, sociogramaticales, sociolexicas, sociodiscursivas y pragmaticas; teniendo en cuenta variables sociales preestratificadas de nivel de instruccion, edad, sexo y procedencia. Tal como lo enuncia Vida Castro (2007:7): «Un buen indicador del conocimiento sobre una lengua y una garantia de que su estudio se aborda con procedimientos rigurosos y actuales es la existencia de corpus lingidsticos extensos y variados que proporcionan una imagen a escala de la actuacion linguistica comunitaria. Estos corpus tienen aplicaciones diversas y utiles (computacion, e ingenieria linguistica, traduccion, elaboracion de diccionarios y gramaticas, sintesis del habla, etc); de entre ellas no es desdenable la que consiste en saber como es la estructura subyacente en las multiples manifestaciones efectivas de una lengua, mas alla de la imagen ideada a partir de conjuntos limitados de datos, cuando no unicamente de los procedentes de la propia intuicion linguistica del gramatico». Corpus que no ha sido recolectado hasta ahora evidenciando un precario estado del arte en la region, lo que trae como consecuencia estudios aislados, fragmentados y muchas veces impresionisticos, en los que, tal como se expresa en la cita, la intuicion del gramatico prevalece sobre la evidencia empirica que puede ofrecer el corpus.