Todoele.net
Otros materiales
 
 Ordenar por:       Titulo   |   Categoria  
Corpus de Habla Infantil Espontánea del Español (CHIEDE)     (Corpus)

www.lllf.uam.es/ESP/Chiede.html

El Corpus de Habla Infantil Espontánea del Español, CHIEDE, está formado por aproximadamente un tercio de habla infantil y dos tercios de habla adulta. Su principal característica es la espontaneidad de las interacciones en él recogidas: los textos son grabaciones de situaciones comunicativas en su contexto natural. La principal característica de CHIEDE es la espontaneidad de sus interacciones: los textos son grabaciones de situaciones comunicativas en su contexto natural.
CHIEDE consta de 58.163 palabras, distribuidas en 30 textos, con un total de 7 horas y 53 minutos de grabación y 59 participantes menores. Cada grabación está alineada con su correspondiente transcripción ortográfica, en la que se incluye una cabecera con los metadatos o información sociolingüística y contextual.

Ancora-Esp     (Corpus)

clic.ub.edu/ancora/index.php

AnCora-Esp es un corpus de árboles sintácticos de 500.000 palabras, enriquecido con información semántica de diversa índole:
1) cada función sintáctica tiene asociado el argumento y el papel temático correspondiente;
2) cada verbo pertenece a una clase semántica, en función de su estructura eventiva y su comportamiento diatético;
3) cada nombre tiene asignado un sentido de la base de conocimiento WordNet y
4) cada entidad nombrada (es decir, personas, organizaciones, lugares, fechas, etc.) está identificada y categorizada.
Como resultado del proceso de anotación, se dispone también de un léxico verbal de 2.000 entradas aprox. con información sobre:
- la clase semántica del verbo y la subcategorización sintáctica,
- la estructura argumental y los roles temáticos para  cada uno de los sentidos.
El corpus AnCora-Esp así como los léxicos verbales derivados AnCora-Verb están disponibles (consultas y descargas) en la página: clic.ub.edu/ancora/index.php.
El corpus AnCora también se ha desarrollado para el catalán.

AP Course Audit     (Silabo)

www.collegeboard.com/html/apcourseaudit/courses/spanish.html

Página web en la que se ofrece una guía para elaborar sílabos para cursos de AP de español. También se incluyen ejemplos ya elaborados.

Australian Curriculum - Spanish     (Currículo)

www.australiancurriculum.edu.au/languages/spanish/context-statement

Currículo de español elaborado por ACARA (Australian Curriculum, Assessment and Reporting Authority).
Scope and SequenceDocumento en pdf

Banco de neologismos     (Corpus)

cvc.cervantes.es/lengua/banco_neologismos/default.htm

Extracción de las bases de datos de neologismos BOBNEO del Observatori de Neologia de l'Institut Universitari de Lingüística Aplicada de la Universitat Pompeu Fabra que recoge los neologismos léxicos procedentes de los medios de comunicación, escritos y orales, en catalán y en español recopilados desde 1992.

CASLS - Center for Applied Second Language Studies     (Evaluación, currículo)

casls.uoregon.edu

Centro de la Universidad de Oregón cuyo objetivo es la mejora de la enseñanza y el aprendizaje de lenguas extranjeras. En el sitio web se recogen materiales, recursos y herramientas dirigidos a profesores.
Incluye diversos recursos y materiales para la evaluación:
- CASLS Assessment Pilot Program (CAP)
- LinguaFolio - Portfolio Tool
- National Online Early Language Learning Assessment (NOELLA)
- Open Collaborative Assessment Platform (Open CAP)
- Standards-based Measurement of Proficiency (STAMP)

CORDE - Corpus Diacrónico del Español     (Corpus)

corpus.rae.es/cordenet.html

El "CORDE [...] contiene unos 250 millones de formas correspondientes a textos de todos los períodos de la historia del español hasta 1974."

Corpus de aprendices de español (CAES)     (Corpus)

galvan.usc.es/caes

El Corpus de aprendices de español como lengua extranjera (CAES) es un conjunto de textos escritos producidos por estudiantes de español con diferentes grados de dominio lingüistico (niveles A1 a C1 del Marco común europeo de referencia, aplicado al español en el Plan curricular del Instituto Cervantes. Niveles de referencia para el español) y procedentes de seis L1: árabe, chino mandarín, francés, inglés, portugués y ruso. Se trata de una herramienta que permite a los profesionales del campo de ELE (profesores, investigadores, evaluadores, autores de materiales didácticos, responsables y equipos de centros e instituciones lingüísticas, etc.) llevar a cabo investigaciones aplicadas sobre la base de datos sólidos y objetivos, ya que puede proporcionar información sobre dificultades de aprendizaje, errores más comunes, vocabulario más o menos empleado, etc. que se podrá aplicar con facilidad en las aulas o integrar en los textos.

En su versión actual (1.0, de octubre de 2014), el CAES comprende casi 575 000 elementos lingüísticos, con una distribución que atiende a todos los niveles adquiridos y lenguas L1 incluidas en esta fase del proyecto. Ha sido construido mediante la recogida de muestras en distintos centros del Instituto Cervantes y universidades de un gran número de países, en un período que va desde octubre de 2011 hasta septiembre de 2013. Aunque las pruebas recogidas fueron más, una vez filtradas las correspondientes a lenguas L1 distintas de las previstas o inservibles por diferentes razones, esta versión de CAES contiene muestras producidas por 1 423 estudiantes, que escribieron dos o tres textos cada uno (según los niveles aprobados), lo cual arroja un total de 3 878 tareas integradas en 1 423 pruebas.

Corpus de Conversaciones en Español como Lengua Extranjera     (Corpus)

linred.com/informacion_pdf/informacion11_24012006.pdf

Este corpus está formado por la transcripción parcial de nueve conversaciones en Español como Lengua Extranjera, mantenidas entre universitarios de diferentes lenguas maternas, predominantemente alemanes. Estas conversaciones se grabaron en la ciudad de Hamburgo durante los meses de febrero y mayo de 2002 y fueron la base del trabajo de investigación tutelado presentado en la universidad de Alcalá en julio de 2004, con el título La competencia conversacional de estudiantes de español como lengua extranjera.

Corpus del Español Actual - CEA     (Corpus)

sfn.uab.es:8080/SFN/tools/cea/spanish

El Corpus del Español Actual (CEA) tiene 540 millones de palabras y está lematizado y etiquetado con información morfológica y/o categorial. El CEA está integrado por los siguientes textos:

Corpus del Español de Mark Davies     (Corpus)

www.corpusdelespanol.org

El corpus contiene 100 millones de palabras:
- 20 millones de los 1200s-1400s
- 40 millones de los 1500s-1700s
- 40 millones de los 1800s-1900s Las 20.000.000 palabras de los 1900s se dividen igualmente entre la literatura, textos orales, y periódicos/enciclopedias.

Corpus del español del siglo XXI - CORPES XXI     (Corpus)

web.frl.es/CORPES/view/inicioExterno.view

El Corpus del Español del Siglo XXI (CORPES XXI) es, al igual que CREA, un corpus de referencia. En lingüística, se llama corpus a un conjunto formado por miles de textos (novelas, obras de teatro, guiones de cine, noticias de prensa, ensayos, transcripciones de noticiarios radiofónicos o televisivos, transcripciones de conversaciones, discursos, etc.) y cientos de millones de formas. Son empleados habitualmente para conocer el significado y características de palabras, expresiones y construcciones a partir de los usos reales registrados. Dado el tamaño que poseen, los corpus tienen que estar en formato electrónico.

Un corpus general (llamado de referencia) tiene como propósito básico el de servir para obtener las características globales que presenta una lengua en un momento determinado de su historia. En el caso del español actual, el corpus debe contener textos de todos los tipos y también de todos los países que constituyen el mundo hispánico.

Corpus del Español Mexicano Contemporáneo - CEMC     (Corpus)

www.corpus.unam.mx:8080/cemc

La conformación del Corpus del Español Mexicano Contemporáneo (CEMC) obedeció a la necesidad de contar con una colección de contextos de uso de las palabras, que sirvieran como base a la elaboración del Diccionario del español de México, y tenía por objetivo deslindar y reconocer las características del español mexicano contemporáneo, sobre todo en cuanto a su léxico.

Sobre la base de varias decisiones de método, sustentadas con argumentos procedentes de la estadística lingüística, que se pueden leer en los libros Investigaciones lingüísticas en lexicografía, de Luis Fernando Lara, Isabel García Hidalgo y Roberto Ham Chande, y en Dimensiones de la lexicografía, del primero de los nombrados, publicados por El Colegio de México, el CEMC quedó formado por un conjunto de 996 "textos" escritos por autores mexicanos desde 1921 hasta 1974, así como por transcripciones de conversaciones grabadas, procedentes de los materiales del Atlas lingüístico de México y de otros acervos lingüístico-etnográficos existentes en la biblioteca de El Colegio de México.

Corpus del Proyecto para el estudio sociolingüístico del español de España y de América (PRESEEA)     (Corpus)

preseea.linguas.net/Corpus.aspx

PRESEEA es un proyecto para la creación de un corpus de lengua española hablada representativo del mundo hispánico en su variedad geográfica y social. Esos materiales se reúnen atendiendo a la diversidad sociolingüística de las comunidades de habla hispanohablantes.

PRESEEA agrupa a cerca de 40 equipos de investigación sociolingüística. Es el fruto del trabajo coordinado de investigadores comprometidos con una metodología común para reunir un banco de materiales coherente que posibilite su aplicación con fines educativos y tecnológicos.

Corpus Escrito del Español L2 (CEDEL2)     (Corpus)

www.uam.es/proyectosinv/woslac/cedel2.htm

Proyecto de investigación patrocinado por el Ministerio de Educación y Ciencia, la Comunidad Autónoma de Madrid y la Universidad Autónoma de Madrid, que estudia como aprenden español los estudiantes cuya primera lengua es el inglés. Para ello está compilando un corpus de textos escritos por estudiantes.

Corpus Lingüístico de Referencia de la Lengua Española en Argentina     (Corpus)

www.lllf.uam.es/ESP/Argentina.html

Base de datos textual (corpus de lengua escrita): más de 2.000.000 de palabras

Corpus lingüístico de referencia de la lengua española en Chile     (Corpus)

www.lllf.uam.es/ESP/Chile.html

Base de datos textual (corpus de lengua escrita): 2.000.000 de palabras

Corpus Oral de Referencia de la Lengua Española Contemporánea (CORLEC)     (Corpus)

www.lllf.uam.es/ESP/Corlec.html

La base de datos textuales denominada Corpus Oral de Referencia del Español Contemporáneo comenzó a elaborarse en enero de 1991, finalizando su realización en febrero de 1992. Se elaboró en la Universidad Autónoma de Madrid con una ayuda de IBM España dentro del programa de cooperación entre IBM España y la Cátedra de Lingüística General de la UAM.
La base de datos recoge 1.100.000 palabras procedentes de la transliteración de textos grabados en cintas de audio del registro oral.

Corpus Oral del Español como Lengua Extranjera (ELE)     (Corpus)

cartago.lllf.uam.es/corele/index.html

El Corpus Oral de Español como Lengua Extranjera es una colección de 40 entrevistas con alumnos de ELE de nivel A2 y B1 (MCER) de más de 9 lenguas maternas (especialmente, portugués, italiano, francés, inglés, alemán, neerlandés, polaco, chino y japonés). El corpus está anotado con errores e integrado en una interfaz que permite escuchar las entrevistas, consultar las transcripciones y buscar errores anotados conforme a distintos criterios: entre otros, nivel lingüístico del error, categoría morfológica, tipo de error, lengua materna del alumno o nivel MCER.

Corpus Val.Es.Co. (Valencia, Español Coloquial)     (Corpus)

www.valesco.es/?q=es/node/13

El corpus Val.Es.Co 2.0 pretende recoger una muestra de español coloquial. Para ello, se han transcrito 46 conversaciones y se han secuenciado en diferentes unidades de análisis: intervenciones, grupos entonativos y palabras. Todas estas unidades están vinculadas unas con otras, de tal manera que puede recorrerse jerárquicamente su relación.

COSER - Corpus Oral y Sonoro del Español Rural     (Corpus)

www.lllf.uam.es:8888/coser

El Corpus Oral y Sonoro del Español Rural (COSER) está formado por grabaciones de la lengua hablada en enclaves rurales de la Península Ibérica, obtenidas con regularidad anual desde 1990. Es un corpus en formación y su volumen sigue creciendo cada año. El COSER se distingue de otros corpus orales del español en que registra el habla de individuos cuya vida transcurre en un entorno rural. Otra novedad del COSER es que es un corpus sonoro que ofrece las grabaciones en formato audio a disposición de cualquier usuario como muestra de las diversas formas de hablar en la Península Ibérica.

CREA - Corpus de Referencia del Español Actual     (Corpus)

corpus.rae.es/creanet.html

El "CREA [...] incorpora algo más de tres millones de formas. Con ello, el CREA se acerca a los 160 millones de registros, producidos en todos los países de habla hispana desde 1975. De ellos, casi 32 millones corresponden al último período (2000-2004) y en este bloque se incorporan textos procedentes de los llamados 'cuadernos de bitácora'".

Currículo de las Escuelas Oficiales de Idiomas de España     (Currículo)

www.boe.es/boe/dias/2005-04-30/pdfs/A14790-14854.pdf

El documento establece los objetivos, contenidos y criterios de evaluación para el nivel básico de las enseñanzas de idiomas en las Escuelas Oficiales de Idiomas de España. Además de los referidos a la enseñanza de español como lengua extranjera, se incluyen también los de alemán, árabe, chino, danés, finés, francés, griego, inglés, irlandés, italiano, japonés, neerlandés, portugués, rumano, ruso, sueco y las lenguas cooficiales de las comunidades autónomas.

Diplomas de Español como Lengua Extranjera del Instituto Cervantes     (Evaluación)

diplomas.cervantes.es

Los Diplomas de Español como Lengua Extranjera (DELE) son títulos oficiales, acreditativos del grado de competencia y dominio del idioma español, que otorga el Instituto Cervantes en nombre del Ministerio de Educación y Ciencia de España. La Universidad de Salamanca colabora con el Instituto Cervantes en la elaboración de los modelos de examen y en la evaluación de las pruebas para la obtención de los Diplomas de Español.
Modelos de examen y audios.

Elementary Spanish Curriculum Project      (Currículo)

www.d.umn.edu/~ezeitz/Curriculum Project/Projectdescription.html

Programa de enseñanza de español a niños desde el jardín de infancia hasta el cuarto curso. Consta de las siguientes secciones: topics, objectives, lesson plans y materials.
Está en inglés.

   1 de 2   

¿Conoces otras páginas interesantes?
Envíanos su direcciónEnviar noticia