CoDiAJe

EN | ES | HE

Menú principal


Powered by <TEI:TOK>
Maarten Janssen, 2014-

CoDiAJe - Corpus diacrónico anotado del judeoespañol (ladino) 


Bienvenido a CoDiAJeCorpus diacrónico anotado del judeoespañol.

CoDiAJe es un corpus multigénero diacrónico que contiene documentos de entre los siglos XVI y XXI, clasificados según su género textual, fecha y origen geográfico, enriquecidos automática o semiautomáticamente con anotaciones lingüísticas de varios tipos.

CoDiAJe contiene metadatos que proporcionan información sobre los autores de los documentos (lugar y fecha de nacimiento, lugar de residencia, estatus social, etc.) y sobre los propios documentos (tipo de texto, fecha y lugar de su creación o impresión, alfabeto en que fue redactado, si se trata de un texto manuscrito o impreso, si es original, traducido o adaptado de otro).

El flujo de trabajo de la edición digital de CoDiAJe se compone de dos tareas principales: el procesamiento lingüístico y anotación de los documentos utilizando diversas herramientas del procesamiento de lenguajes naturales (Freeling: http://nlp.lsi.upc.edu/freeling/ y Neotag: http://www.lrec-conf.org/proceedings/lrec2012/summaries/1098.html) y la codificación de metadatos y anotación lingüística incorporada a los textos usando XML para ser visualizados y realizar las búsquedas con TEITOK.

 

Cómo citar este corpus

CoDiAJe - Corpus diacrónico anotado del judeoespañol. Directora: Aldina Quintana. Disponible en línea: http://corptedig-glif.upf.edu/teitok/codiaje/ [Fecha de la consulta].

----

CoDiAJe forma parte de los proyectos de investigación núm. 473/11 y 486/19 financiados por la Fundación de Ciencias de Israel (ISF).

2019-12-09