Corpus - corpus escrito
https://github.com/togethercomputer/RedPajama-Data RedPajama-Data-v2 es un corpus multilingüe de acceso abierto para el entrenamiento de modelos de lenguaje, que está formado por 30 billones de formas... Ver más» |
Corpus del Español del Siglo XXI (CORPES XXI) https://www.rae.es/banco-de-datos/corpes-xxi En el congreso celebrado en Medellín en marzo de 2007, las academias de la lengua española acordaron encomendar a la Real Academia Española la... Ver más» |
http://iberia.cchs.csic.es/cgi-bin/iberia.cgi "El corpus Iberia es una herramienta informática creada entre 2008 y 2009 en el seno del Consejo Superior de Investigaciones Científicas para los estudios... Ver más» |
Corpus de ELE en Japón (CELEN) https://sites.google.com/view/celen Aplicación de consulta El Corpus de ELE en Japón (CELEN) es un corpus de aprendices de español cuya primera lengua es el japonés. Los datos que lo... Ver más» |
Corpus de español hablado y escrito por sinohablantes (CorSinoELE) El corpus CorSinoELE. Corpus de español hablado y escrito por sinohablantes consta de 395 textos orales y escritos producidos por 99 hablantes chinos... Ver más» |
En esta sección se recopilarán los corpus del español disponibles en la red.