Extracción de Relaciones Supervisadas a Distancia Mejorada Semánticamente a través de Redes de Atención de Grafos
Autores: Ouyang, Xiaoye; Chen, Shudong; Wang, Rong
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Extracción de Relaciones Supervisadas a Distancia Mejorada Semánticamente a través de Redes de Atención de Grafos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Supervisión distante
Extracción de relaciones
Grafo de conocimiento
Palabras ruidosas
Redes de atención gráfica
Características semánticas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los métodos de extracción de relaciones supervisados de forma distante pueden extraer automáticamente la relación entre pares de entidades, lo cual es esencial para la construcción de un grafo de conocimiento. Sin embargo, los conjuntos de datos construidos automáticamente comprenden cantidades de oraciones de baja calidad y palabras ruidosas, y los métodos supervisados de forma distante actuales ignoran estos datos ruidosos, lo que resulta en una precisión inaceptable. Para mitigar este problema, presentamos un nuevo enfoque supervisado de forma distante SEGRE (Redes de Atención Gráfica Mejoradas Semánticamente para la Extracción de Relaciones) para mejorar la extracción de relaciones. Nuestro modelo utiliza primero la información de posición de palabras y tipo de entidad para proporcionar abundantes características locales y conocimiento de fondo. Luego, construye los árboles de dependencia para eliminar palabras ruidosas que son irrelevantes para las relaciones y emplea Redes de Atención Gráfica (GATs) para codificar información sintáctica, que también captura las características semánticas importantes de las palabras relacionales en cada instancia. Además, para hacer que nuestro modelo sea más robusto contra palabras ruidosas, se utiliza el módulo de atención intra-bolsa para ponderar la representación de la bolsa y mitigar el ruido en la bolsa. A través de extensos experimentos en los conjuntos de datos Riedel New York Times (NYT) y Google IISc Distantly Supervised (GIDS), demostramos la efectividad de SEGRE.
Descripción
Los métodos de extracción de relaciones supervisados de forma distante pueden extraer automáticamente la relación entre pares de entidades, lo cual es esencial para la construcción de un grafo de conocimiento. Sin embargo, los conjuntos de datos construidos automáticamente comprenden cantidades de oraciones de baja calidad y palabras ruidosas, y los métodos supervisados de forma distante actuales ignoran estos datos ruidosos, lo que resulta en una precisión inaceptable. Para mitigar este problema, presentamos un nuevo enfoque supervisado de forma distante SEGRE (Redes de Atención Gráfica Mejoradas Semánticamente para la Extracción de Relaciones) para mejorar la extracción de relaciones. Nuestro modelo utiliza primero la información de posición de palabras y tipo de entidad para proporcionar abundantes características locales y conocimiento de fondo. Luego, construye los árboles de dependencia para eliminar palabras ruidosas que son irrelevantes para las relaciones y emplea Redes de Atención Gráfica (GATs) para codificar información sintáctica, que también captura las características semánticas importantes de las palabras relacionales en cada instancia. Además, para hacer que nuestro modelo sea más robusto contra palabras ruidosas, se utiliza el módulo de atención intra-bolsa para ponderar la representación de la bolsa y mitigar el ruido en la bolsa. A través de extensos experimentos en los conjuntos de datos Riedel New York Times (NYT) y Google IISc Distantly Supervised (GIDS), demostramos la efectividad de SEGRE.