Expansión y extracción semiautomática de corpus de entidades y relaciones nombradas en uigur basada en un método híbrido
Autores: Halike, Ayiguli; Abiderexiti, Kahaerjiang; Yibulayin, Tuergen
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Expansión y extracción semiautomática de corpus de entidades y relaciones nombradas en uigur basada en un método híbrido
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Extracción de relaciones
Entidad nombrada en uigur
Construcción de corpus
Método de extracción
Herramienta de anotación
Resultados experimentales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La extracción de relaciones es una tarea importante con muchas aplicaciones en el procesamiento del lenguaje natural, como la extracción de conocimiento estructurado, la construcción de grafos de conocimiento y la construcción de sistemas automáticos de respuesta a preguntas. Sin embargo, relativamente poco trabajo previo se ha centrado en la construcción del corpus y la extracción de relaciones de entidades nombradas en uyghur, lo que resulta en una disponibilidad muy limitada de investigación sobre extracción de relaciones y una deficiencia de datos de relaciones anotados. Este problema se aborda en el presente artículo proponiendo un método híbrido de extracción de relaciones de entidades nombradas en uyghur que combina un modelo de campo aleatorio condicional para hacer sugerencias sobre la anotación basada en relaciones extraídas con un conjunto de reglas aplicadas por anotadores humanos para aumentar rápidamente el tamaño del corpus uyghur. Integramos nuestro método de extracción de relaciones en una herramienta de anotación existente y, con la ayuda de la corrección humana, implementamos la extracción de relaciones en uyghur y expandimos el corpus existente. La efectividad de nuestro enfoque propuesto se demuestra en base a resultados experimentales utilizando un corpus uyghur existente, y nuestro método logra un promedio ponderado máximo entre precisión y recuperación del 61.34%. El método que proponemos logra resultados de vanguardia en tareas de extracción de entidades y relaciones en uyghur.
Descripción
La extracción de relaciones es una tarea importante con muchas aplicaciones en el procesamiento del lenguaje natural, como la extracción de conocimiento estructurado, la construcción de grafos de conocimiento y la construcción de sistemas automáticos de respuesta a preguntas. Sin embargo, relativamente poco trabajo previo se ha centrado en la construcción del corpus y la extracción de relaciones de entidades nombradas en uyghur, lo que resulta en una disponibilidad muy limitada de investigación sobre extracción de relaciones y una deficiencia de datos de relaciones anotados. Este problema se aborda en el presente artículo proponiendo un método híbrido de extracción de relaciones de entidades nombradas en uyghur que combina un modelo de campo aleatorio condicional para hacer sugerencias sobre la anotación basada en relaciones extraídas con un conjunto de reglas aplicadas por anotadores humanos para aumentar rápidamente el tamaño del corpus uyghur. Integramos nuestro método de extracción de relaciones en una herramienta de anotación existente y, con la ayuda de la corrección humana, implementamos la extracción de relaciones en uyghur y expandimos el corpus existente. La efectividad de nuestro enfoque propuesto se demuestra en base a resultados experimentales utilizando un corpus uyghur existente, y nuestro método logra un promedio ponderado máximo entre precisión y recuperación del 61.34%. El método que proponemos logra resultados de vanguardia en tareas de extracción de entidades y relaciones en uyghur.