Corpus Iberia

Enlace

http://iberia.cchs.csic.es/cgi-bin/iberia.cgi

Etiquetas

Descripción

"El corpus Iberia es una herramienta informática creada entre 2008 y 2009 en el seno del Consejo Superior de Investigaciones Científicas para los estudios sobre el español, lengua de la ciencia en la sociedad del conocimiento. Se trata de un corpus textual panhispánico sobre el discurso científico-técnico (1985-hoy). Los objetivos que persigue son los siguientes: (a) recopilar el mayor número posible de documentos científicos escritos en español, (b) actualizar permanentemente con la producción científica de última hora, (c) indexar los documentos incorporando la mayor cantidad de información lingüística posible y (d) crear una herramienta útil a través de una interfaz de consulta lo más versátil, potente y sencilla posible. En la actualidad contiene 66.584 documentos y 280 millones de palabras aproximadamente referidos al español científico-técnico del español de España entre 1985 y 2015.

Todas las palabras están analizadas lingüísticamente (con el lema, la clase de palabras y los rasgos morfológicos) e indexadas. A través de una interfaz de consulta es posible recuperar no solo los contextos de aparición de estas palabras, sino información sobre otras palabras con la que coaparecen y sobre como distribuyen las apariciones en los distintos ámbitos cientifico-técnicos."