Corpus - Materiales
https://dh.dlls.univr.it/corpora/diacomes/ El corpus DIACOM-es es un corpus diacrónico especializado que reúne textos de ámbito comercial en lengua española. Se publicó en 2022 en el seno del Depto... Ver más» |
Corpus de textos escritos para el análisis de errores de aprendices de E/LE (CORANE) https://mele.web.uah.es/materiales-ele/ Cuadernillo del corpus Muestras de textos para descargar: Nivel A2 - Plataforma Nivel B1 - Umbral Nivel B2 - Avanzado Nivel C1 -... Ver más» |
https://github.com/togethercomputer/RedPajama-Data RedPajama-Data-v2 es un corpus multilingüe de acceso abierto para el entrenamiento de modelos de lenguaje, que está formado por 30 billones de formas... Ver más» |
Corpus oral del español de los migrantes residentes en la ciudad de Sevilla https://corpusmigrasev.snlt.es/ La ciudad de Sevilla (España) ha sido y sigue siendo receptora de nuevos habitantes de procedencia diferente, lo que la convierte en un punto... Ver más» |
Corpus del Español del Siglo XXI (CORPES XXI) https://www.rae.es/banco-de-datos/corpes-xxi En el congreso celebrado en Medellín en marzo de 2007, las academias de la lengua española acordaron encomendar a la Real Academia Española la... Ver más» |
http://iberia.cchs.csic.es/cgi-bin/iberia.cgi "El corpus Iberia es una herramienta informática creada entre 2008 y 2009 en el seno del Consejo Superior de Investigaciones Científicas para los estudios... Ver más» |
Corpus léxico del español de Colombia https://clicc.caroycuervo.gov.co/corpus/CorlexCo El Corpus léxico del español de Colombia recopila combinaciones léxicas, con criterio integral, es decir, las propias del país, las compartidas con otros... Ver más» |
Corpus Dinámico del Español de la Inmigración (CORDIESIN) http://corpuscordiesin.uah.es/ Los movimientos migratorios han transformado las ciudades en puntos multiculturales y plurilingües mediante procesos de gran complejidad social que han... Ver más» |
Corpus de ELE en Japón (CELEN) https://sites.google.com/view/celen Aplicación de consulta El Corpus de ELE en Japón (CELEN) es un corpus de aprendices de español cuya primera lengua es el japonés. Los datos que lo... Ver más» |
AnCora es un corpus del catalán (AnCora-CA) y del español (AnCora-ES) con diferentes niveles de anotación: lema y categoría morfológica... Ver más» |
Pages
En esta sección se recopilarán los corpus del español disponibles en la red.