Todoele.net

Otros materiales
 Volver a la lista
Nombre 
Ancora-Esp 
Categoría 
Corpus 
Fuente 
Centro de Lenguaje y Computación de la Universidad de Barcelona y los grupos de Procesamiento del Lenguaje Natural de la Universidad de Alicante y la Universidad Politécnica de Cataluña 
Enlace 
clic.ub.edu/ancora/index.php 
Descripción 
AnCora-Esp es un corpus de árboles sintácticos de 500.000 palabras, enriquecido con información semántica de diversa índole:
1) cada función sintáctica tiene asociado el argumento y el papel temático correspondiente;
2) cada verbo pertenece a una clase semántica, en función de su estructura eventiva y su comportamiento diatético;
3) cada nombre tiene asignado un sentido de la base de conocimiento WordNet y
4) cada entidad nombrada (es decir, personas, organizaciones, lugares, fechas, etc.) está identificada y categorizada.
Como resultado del proceso de anotación, se dispone también de un léxico verbal de 2.000 entradas aprox. con información sobre:
- la clase semántica del verbo y la subcategorización sintáctica,
- la estructura argumental y los roles temáticos para  cada uno de los sentidos.
El corpus AnCora-Esp así como los léxicos verbales derivados AnCora-Verb están disponibles (consultas y descargas) en la página: clic.ub.edu/ancora/index.php.
El corpus AnCora también se ha desarrollado para el catalán. 
Contenido 
 
Comentarios 
 
 Volver a la lista