Anotando un idioma de bajos recursos con tecnología LLOD: morfología y sintaxis sumeria
Autores: Chiarcos, Christian; Khait, Ilya; Pagé-Perron, Émilie; Schenk, Niko; Jayanth, ; Fäth, Christian; Steuer, Julius; Mcgrath, William; Wang, Jinyan
Idioma: Inglés
Editor: MDPI
Año: 2018
Acceso abierto
Artículo científico
2018
Anotando un idioma de bajos recursos con tecnología LLOD: morfología y sintaxis sumeria
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Cuneiform
Sumerio
Anotación
Traducción automática
Sintaxis
Asiriología
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Este documento describe el trabajo sobre la anotación morfológica y sintáctica del cuneiforme sumerio como un modelo para lenguas de bajos recursos en general. Los textos cuneiformes son fuentes invaluables para el estudio de la historia, las lenguas, la economía y las culturas de la antigua Mesopotamia y sus regiones circundantes. La asiriología, la disciplina dedicada a su estudio, tiene un vasto potencial de investigación, pero carece de los medios modernos para el procesamiento y análisis computacional. Nuestro proyecto, Traducción Automática y Análisis Automatizado de Lenguas Cuneiformes, tiene como objetivo llenar este vacío al reunir datos de corpus, datos léxicos, anotaciones lingüísticas y metadatos de objetos. El objetivo principal del proyecto es construir una canalización para la traducción automática y la anotación de textos administrativos sumerios de Ur III. Los datos ricos y estructurados se harán accesibles en forma de Datos Abiertos Vinculados (LLOD), lo que debería abrirlos a una comunidad de investigación más amplia. Nuestra contribución es doble: en términos de tecnología del lenguaje, nuestro trabajo representa el primer intento de desarrollar una infraestructura integrativa para la anotación de morfología y sintaxis sobre la base de tecnologías RDF y recursos LLOD. Con respecto a la asiriología, trabajamos para producir el primer corpus sintácticamente anotado de sumerio.
Descripción
Este documento describe el trabajo sobre la anotación morfológica y sintáctica del cuneiforme sumerio como un modelo para lenguas de bajos recursos en general. Los textos cuneiformes son fuentes invaluables para el estudio de la historia, las lenguas, la economía y las culturas de la antigua Mesopotamia y sus regiones circundantes. La asiriología, la disciplina dedicada a su estudio, tiene un vasto potencial de investigación, pero carece de los medios modernos para el procesamiento y análisis computacional. Nuestro proyecto, Traducción Automática y Análisis Automatizado de Lenguas Cuneiformes, tiene como objetivo llenar este vacío al reunir datos de corpus, datos léxicos, anotaciones lingüísticas y metadatos de objetos. El objetivo principal del proyecto es construir una canalización para la traducción automática y la anotación de textos administrativos sumerios de Ur III. Los datos ricos y estructurados se harán accesibles en forma de Datos Abiertos Vinculados (LLOD), lo que debería abrirlos a una comunidad de investigación más amplia. Nuestra contribución es doble: en términos de tecnología del lenguaje, nuestro trabajo representa el primer intento de desarrollar una infraestructura integrativa para la anotación de morfología y sintaxis sobre la base de tecnologías RDF y recursos LLOD. Con respecto a la asiriología, trabajamos para producir el primer corpus sintácticamente anotado de sumerio.