CoDiAJe

EN | ES | HE

Menú principal


Powered by TEITOK
© Maarten Janssen, 2014-

CoDiAJe - Corpus de Ladino 


 

Bienvenido a CoDiAJeCorpus diacrónico anotado del judeoespañol.

CoDiAJe es un corpus multigénero diacrónico que contiene documentos de entre los siglos XVI y XXI, clasificados según su género textual, fecha y origen geográfico, enriquecidos automática o semiautomáticamente con anotaciones lingüísticas de varios tipos.

CoDiAJe contiene metadatos que proporcionan información sobre los autores de los documentos (lugar y fecha de nacimiento, lugar de residencia, estatus social, etc.) y sobre los propios documentos (tipo de texto, fecha y lugar de su creación o impresión, alfabeto en que fue redactado, si se trata de un texto manuscrito o impreso, si es original, traducido o adaptado de otro).

El flujo de trabajo de la edición digital de CoDiAJe se compone de dos tareas principales: el procesamiento lingüístico y anotación de los documentos utilizando diversas herramientas del procesamiento de lenguajes naturales (Freeling: http://nlp.lsi.upc.edu/freeling/ y Neotag: http://www.lrec-conf.org/proceedings/lrec2012/summaries/1098.html) y la codificación de metadatos y anotación lingüística incorporada a los textos usando XML para ser visualizados y realizar las búsquedas con TEITOK.

 

Cómo citar este corpus

CoDiAJe - Corpus diacrónico anotado del judeoespañol. Directora: Aldina Quintana. Disponible en línea: http://corptedig-glif.upf.edu/teitok/codiaje/ [Fecha de la consulta].

2015-12-09