CoOrAJe

EN | ES | HE

MenĂº principal


Powered by <TEI:TOK>
Maarten Janssen, 2014-

CoOrAJe - Corpus Oral de Ladino 


 

Bienvenido a CoOrAJe - el Corpus oral anotado del judeoespañol.

CoOrAJe es un corpus multigénero que contiene documentos orales, clasificados según su género textual, fecha y origen geográfico, acompañados de la correspondiente transcripción enriquecida automática o semiautomáticamente con anotaciones lingüísticas de varios tipos.

CoOrAJe contiene metadatos que proporcionan información sobre los autores de los documentos orales (lugar y fecha de nacimiento, lugar de residencia, estatus social, etc.) y sobre los propios documentos (tipo de texto, fecha y lugar de su creación, etc.)

El flujo de trabajo de la edición digital de CoOrAJe se compone de dos tareas principales: el procesamiento lingüístico y anotación de los documentos utilizando diversas herramientas del procesamiento de lenguajes naturales (Freeling: http://nlp.lsi.upc.edu/freeling/ y Neotag: http://www.lrec-conf.org/proceedings/lrec2012/summaries/1098.html) y la codificación de metadatos y anotación lingüística incorporada a los textos usando XML para ser visualizados y realizar las búsquedas con TEITOK.

Cómo citar este corpus

CoOrAJe - Corpus oral anotado del judeoespañol. Directora: Aldina Quintana. Disponible en línea: http://corptedig-glif.upf.edu/teitok/cooraje/ [Fecha de la consulta].

12/08/2018