logo móvil
Contáctanos

Expansión y extracción semiautomática de corpus de entidades y relaciones nombradas en uigur basada en un método híbrido

Autores: Halike, Ayiguli; Abiderexiti, Kahaerjiang; Yibulayin, Tuergen

Idioma: Inglés

Editor: MDPI

Año: 2020

Descargar PDF

Acceso abierto

Artículo científico
2020

Expansión y extracción semiautomática de corpus de entidades y relaciones nombradas en uigur basada en un método híbrido


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Extracción de relaciones
Entidad nombrada en uigur
Construcción de corpus
Método de extracción
Herramienta de anotación
Resultados experimentales

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
La extracción de relaciones es una tarea importante con muchas aplicaciones en el procesamiento del lenguaje natural, como la extracción de conocimiento estructurado, la construcción de grafos de conocimiento y la construcción de sistemas automáticos de respuesta a preguntas. Sin embargo, relativamente poco trabajo previo se ha centrado en la construcción del corpus y la extracción de relaciones de entidades nombradas en uyghur, lo que resulta en una disponibilidad muy limitada de investigación sobre extracción de relaciones y una deficiencia de datos de relaciones anotados. Este problema se aborda en el presente artículo proponiendo un método híbrido de extracción de relaciones de entidades nombradas en uyghur que combina un modelo de campo aleatorio condicional para hacer sugerencias sobre la anotación basada en relaciones extraídas con un conjunto de reglas aplicadas por anotadores humanos para aumentar rápidamente el tamaño del corpus uyghur. Integramos nuestro método de extracción de relaciones en una herramienta de anotación existente y, con la ayuda de la corrección humana, implementamos la extracción de relaciones en uyghur y expandimos el corpus existente. La efectividad de nuestro enfoque propuesto se demuestra en base a resultados experimentales utilizando un corpus uyghur existente, y nuestro método logra un promedio ponderado máximo entre precisión y recuperación del 61.34%. El método que proponemos logra resultados de vanguardia en tareas de extracción de entidades y relaciones en uyghur.

Otros recursos que podrían interesarte

Temas Virtualpro