Menú de cuenta de usuario

  • Iniciar sesión
Inicio
todoele
  • Inicio
  • Materiales
    • 📋 Actividades
    • 📝 Conjugación
    • 📊 Corpus
    • 📔 Diccionarios
    • ✅ Evaluación
    • ⚙️ Gramática
    • 📗 Manuales
    • ✍️ Ortografía
    • 📅 Programación
    • 🗣️ Pronunciación
    • 📁 Recursos
    • 🔤 Vocabulario
  • Formación
    • 👥 Congresos
    • 🎓 Cursos
    • 🏫 Centros
    • 🏢 Organizaciones
    • 📚 Bibliografía
    • 📰 Revistas
    • 🌍 Atlas de ELE
  • Trabajo
    • 💼 Ofertas de trabajo
    • ℹ️ Trabajo - Recursos
  • En la red
    • 🌐 Sitios ELE
  • Tecnología
    • 💻 Herramientas digitales

Ruta de navegación

  • Inicio
  • Corpus
  • Corpus del Español Actual (CEA)

Corpus del Español Actual (CEA)

http://cea.spanishfn.org/cea/
español actual

El Corpus del Español Actual (CEA) tiene 540 millones de palabras y está lematizado y etiquetado con información morfológica y/o categorial. El CEA está integrado por los siguientes elementos:

  • la parte española del corpus paralelo español-inglés Europarl: European Parliament Proceedings Parallel Corpus v. 6 (1996-2010),
  • el módulo en lengua española del Wikicorpus v. 1.0, que contiene una parte importante de la Wikipedia (2006), y
  • la sección en español del MultiUN: Multilingual UN Parallel Text 2000-2009, un corpus integrado por resoluciones de la Organización de las  Naciones Unidas (ONU).

La etiquetación del CEA se ha realizado con una aplicación que utiliza un diccionario electrónico del español de 635.000 formas, generadas automáticamente a partir de un diccionario de 86.000 lemas simples, como p. ej., unir, inmoralidad, allí, etc., y 26.000 lemas locutivos, como p. ej., muerte cerebral, carga de profundidad, de armas tomar, etc. (Subirats 1989, 1992, 1994a, 1994b,  Mogorrón 1994, Garrido 1999, Ríos 1999, Bobes 2000). La desambiguación de la etiquetación se ha llevado a cabo mediante un proceso de intersección de autómatas, que utiliza información léxica y sintáctica (Subirats 1998, Subirats y Ortega 2000, 2001, Ortega en preparación).

  • 1 vista

Etiquetas

  • corpus sonoro (10)
  • corpus oral (6)
  • corpus de estudiantes (5)
  • corpus escrito (5)
  • corpus de vídeo (3)
  • corpus general (3)
  • corpus de referencia (2)
  • corpus multilingüe (2)
  • español para fines específicos (2)
  • inmigrantes (2)
  • variedades geográficas (2)
  • variedades sociales (2)
  • ámbito comercial (1)
  • arquitectura (1)
  • audio (1)
ver todas »
Sobre Todoele Índice Publica Contacto: todoele@gmail.com
Política de privacidad Créditos