Extracción de Información Abierta Multilingüe: Desafíos y Oportunidades
Autores: Claro, Daniela Barreiro; Souza, Marlo; Castellã Xavier, Clarissa; Oliveira, Leandro
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Extracción de Información Abierta Multilingüe: Desafíos y Oportunidades
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Documentos
Idiomas
Extracción de Información Abierta
Multilingüe
Adquisición de conocimiento
Procesamiento de Lenguaje Natural
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El número de documentos publicados en la Web en idiomas distintos al inglés crece cada año. Como consecuencia, la necesidad de extraer información útil de diferentes idiomas aumenta, destacando la importancia de la investigación en técnicas de Extracción de Información Abierta (OIE). Diferentes métodos de OIE han tratado características de un único idioma; sin embargo, pocos enfoques abordan aspectos multilingües. En esos enfoques, el multilingüismo se limita a procesar texto en diferentes idiomas, en lugar de explorar recursos cruzados entre idiomas, lo que resulta en baja precisión debido al uso de reglas generales. Se han aplicado métodos multilingües a numerosos problemas en el Procesamiento del Lenguaje Natural, logrando resultados satisfactorios y demostrando que la adquisición de conocimiento para un idioma puede transferirse a otros idiomas para mejorar la calidad de los hechos extraídos. Sostenemos que un enfoque multilingüe puede mejorar los métodos de OIE, ya que es ideal para evaluar y comparar sistemas de OIE, y por lo tanto, puede aplicarse a los hechos recopilados. En este trabajo, discutimos cómo la transferencia de conocimiento entre idiomas puede aumentar la adquisición a partir de enfoques multilingües. Proporcionamos una hoja de ruta del área de OIE Multilingüe en relación con los estudios de vanguardia. Además, evaluamos la transferencia de conocimiento para mejorar la calidad de los hechos extraídos en cada idioma. Además, discutimos la importancia de un corpus paralelo para evaluar y comparar sistemas multilingües.
Descripción
El número de documentos publicados en la Web en idiomas distintos al inglés crece cada año. Como consecuencia, la necesidad de extraer información útil de diferentes idiomas aumenta, destacando la importancia de la investigación en técnicas de Extracción de Información Abierta (OIE). Diferentes métodos de OIE han tratado características de un único idioma; sin embargo, pocos enfoques abordan aspectos multilingües. En esos enfoques, el multilingüismo se limita a procesar texto en diferentes idiomas, en lugar de explorar recursos cruzados entre idiomas, lo que resulta en baja precisión debido al uso de reglas generales. Se han aplicado métodos multilingües a numerosos problemas en el Procesamiento del Lenguaje Natural, logrando resultados satisfactorios y demostrando que la adquisición de conocimiento para un idioma puede transferirse a otros idiomas para mejorar la calidad de los hechos extraídos. Sostenemos que un enfoque multilingüe puede mejorar los métodos de OIE, ya que es ideal para evaluar y comparar sistemas de OIE, y por lo tanto, puede aplicarse a los hechos recopilados. En este trabajo, discutimos cómo la transferencia de conocimiento entre idiomas puede aumentar la adquisición a partir de enfoques multilingües. Proporcionamos una hoja de ruta del área de OIE Multilingüe en relación con los estudios de vanguardia. Además, evaluamos la transferencia de conocimiento para mejorar la calidad de los hechos extraídos en cada idioma. Además, discutimos la importancia de un corpus paralelo para evaluar y comparar sistemas multilingües.