Corpus
Nº de entradas: 30AnCora es un corpus del catalán (AnCora-CA) y del español (AnCora-ES) con diferentes niveles de anotación:
lema y categoría morfológica
constituyentes y funciones sintácticas
estructura argumental y... Leer más
Aplicación de consulta
El Corpus de ELE en Japón (CELEN) es un corpus de aprendices de español cuya primera lengua es el japonés. Los datos que lo forman proceden de diversos contextos: el ámbito... Leer más
Los movimientos migratorios han transformado las ciudades en puntos multiculturales y plurilingües mediante procesos de gran complejidad social que han tenido su reflejo en las lenguas. Como... Leer más
El Corpus léxico del español de Colombia recopila combinaciones léxicas, con criterio integral, es decir, las propias del país, las compartidas con otros países hispanoamericanos y con el español... Leer más
"El corpus Iberia es una herramienta informática creada entre 2008 y 2009 en el seno del Consejo Superior de Investigaciones Científicas para los estudios sobre el español, lengua de la ciencia en la... Leer más
El corpus CALMER (Corpus comparable para el estudio de la Adquisición y de las Lenguas: Multilingüe, Emoción, Relato) está compuesto por relatos narrativos manuscritos inspirados en un mismo relato... Leer más
La ciudad de Sevilla (España) ha sido y sigue siendo receptora de nuevos habitantes de procedencia diferente, lo que la convierte en un punto multicultural y plurilingüe omnipresente en numerosos... Leer más
Este sitio contiene grabaciones en vídeo de conversaciones naturales entre hablantes de español para ser usadas como fuentes de lengua en enseñanza y aprendizaje de esta lengua. Las grabaciones han... Leer más
RedPajama-Data-v2 es un corpus multilingüe de acceso abierto para el entrenamiento de modelos de lenguaje, que está formado por 30 billones de formas léxicas (tokens), repartidos en 20.000... Leer más
Corpus creado por Mark Davies.
Tiene cinco componentes:
Género / Histórico
Este es el Corpus del Español "original" (2001).
El corpus contiene 100 millones de palabras de entre el siglo XIII... Leer más
Etiquetas
- corpus sonoro (10)
- corpus oral (6)
- corpus de estudiantes (5)
- corpus escrito (5)
- corpus de vídeo (3)
- corpus general (3)
- corpus de referencia (2)
- corpus multilingüe (2)
- español para fines específicos (2)
- inmigrantes (2)
- variedades geográficas (2)
- variedades sociales (2)
- ámbito comercial (1)
- arquitectura (1)
- audio (1)