Corpus
Nº de entradas: 30RedPajama-Data-v2 es un corpus multilingüe de acceso abierto para el entrenamiento de modelos de lenguaje, que está formado por 30 billones de formas léxicas (tokens), repartidos en 20.000... Leer más
En el congreso celebrado en Medellín en marzo de 2007, las academias de la lengua española acordaron encomendar a la Real Academia Española la construcción del Corpus del Español del Siglo XXI (... Leer más
Cuadernillo del corpus
Muestras de textos para descargar:
Nivel A2 - Plataforma
Nivel B1 - Umbral
Nivel B2 - Avanzado
Nivel C1 - Dominio operativo eficaz
"[...] el análisis de errores... Leer más
El CREA cuenta, en su última versión (3.2, junio de 2008), con algo más de ciento sesenta millones de formas. Se compone de una amplia variedad de textos escritos y orales, producidos en todos los... Leer más
El corpus DIACOM-es es un corpus diacrónico especializado que reúne textos de ámbito comercial en lengua española. Se publicó en 2022 en el seno del Depto. de Lenguas y Literaturas Extranjeras de la... Leer más
El Corpus Diacrónico y Diatópico del Español de América reúne tres conjuntos documentales; CORDIAM-Documentos, CORDIAM-Literatura y CORDIAM-Prensa.
El CORDIAM contiene solo textos producidos en... Leer más
El objetivo del programa SPLLOC es promover la investigación sobre la adquisición del español como L2.
El programa cuenta con dos proyectos SPLLOC 1 (abril 2006 - marzo 2008) y SPLLOC 2 (agosto... Leer más
El Corpus de aprendices de español como lengua extranjera (CAES) es un conjunto de textos escritos producidos por estudiantes de español con diferentes grados de dominio lingüistico (niveles A1 a C1... Leer más
CEDEL2 es un corpus lingüístico de aprendices de español que empezó a desarrollarse en 2006. La versión actual, versión 2, que incluye los datos de la 1, recoge las producciones de 4399 participantes... Leer más
Corpus de arquitectura y construcción que recoge un millón de palabras, en cada uno de estos idiomas: español, francés, italiano, alemán y ruso. Es un corpus dirigido a estudiantes de... Leer más
Etiquetas
- corpus sonoro (10)
- corpus oral (6)
- corpus de estudiantes (5)
- corpus escrito (5)
- corpus de vídeo (3)
- corpus general (3)
- corpus de referencia (2)
- corpus multilingüe (2)
- español para fines específicos (2)
- inmigrantes (2)
- variedades geográficas (2)
- variedades sociales (2)
- ámbito comercial (1)
- arquitectura (1)
- audio (1)