La nueva versión del ‘Corpus Documental do Galego Actual’, una herramienta lingüística en línea que representa y plasma el uso del idioma en la actualidad, ya supera los 40 millones de palabras e incluye 25 horas de transcripciones ortográficas de programas de radio en las que se alinean texto y voz.
Esta actualización del ‘Corga’ ha sido presentada este lunes en la sede del Centro Ramón Piñeiro para a Investigación en Humanidades, con la presencia entre otros del secretario xeral de Política Lingüística, Valentín García.
El corpus está integrado por distintos tipos de textos, desde periódicos y semanarios hasta ensayos y obras de ficción, que se extienden desde el año 1975 hasta la actualidad. La amplitud de documentos que abarca y los criterios empleados en su selección permiten considerarlo como referencia y representativo del uso lingüístico del gallego.
Entre las principales novedades que incluye en esta versión, la Xunta destaca la visualización de la información recuperada en forma de expresiones coincidentes, de modo que los resultados iguales se reducen a uno; y la presentación, a modo de diccionario de frecuencias o listados personalizados de formas, etiquetas y lemas.
Política Lingüística incide, de este modo, en la «flexibilidad y potencialidad» de la aplicación de consulta, a través de diferentes variables clasificatorias de los documentos y diversas modalidades de búsqueda.
García ha situado al Corga como uno de los proyectos de investigación «que se centran en darle cumplimiento» a la misión del Centro Ramón Piñeiro que apunta, entre otras finalidades, al «diseño y desarrollo de recursos informáticos que ayuden a la incorporación de la lengua gallega al mundo de las tecnologías de la información y de la comunicación».