Spece: codificador de posición del sujeto en incrustación compleja para extracción de relaciones
Autores: Wu, Shangjia; Guo, Zhiqiang; Huang, Xiaofeng; Zhang, Jialiang; Ni, Yingfang
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Spece: codificador de posición del sujeto en incrustación compleja para extracción de relaciones
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Procesamiento de lenguaje natural
Entidades
Relaciones
Datos estructurados
Grafos de conocimiento
Extracción de relaciones de entidades
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 38
Citaciones: Sin citaciones
Como componente crucial de muchas tareas de procesamiento de lenguaje natural, la extracción de entidades y relaciones transforma la información de texto no estructurado en datos estructurados, proporcionando un apoyo esencial para la construcción de grafos de conocimiento (KGs). Sin embargo, los modelos actuales de extracción de entidades y relaciones a menudo priorizan la extracción de características semánticas más ricas o la optimización de métodos de extracción de relaciones, pasando por alto la importancia de la información posicional y las características del sujeto en esta tarea. Para resolver este problema, presentamos el modelo de extracción de entidades y relaciones basado en la posición del sujeto y el incrustamiento exponencial complejo (SPECE). El módulo codificador de este modelo combina ingeniosamente una red convolucional dilatada inicializada aleatoriamente con un codificador BERT. Destacadamente, determina la posición inicial del sujeto predicho basándose en señales semánticas. Además, logra una integración armoniosa de las características de codificación posicional y las características de texto a través de la adopción del método de incrustamiento exponencial complejo. Los resultados experimentales en los conjuntos de datos NYT y WebNLG revelan que, en comparación con otros modelos de referencia, nuestro modelo propuesto SPECE demuestra mejoras significativas en la puntuación F1 en ambos conjuntos de datos. Esto valida aún más su eficacia y superioridad.
Descripción
Como componente crucial de muchas tareas de procesamiento de lenguaje natural, la extracción de entidades y relaciones transforma la información de texto no estructurado en datos estructurados, proporcionando un apoyo esencial para la construcción de grafos de conocimiento (KGs). Sin embargo, los modelos actuales de extracción de entidades y relaciones a menudo priorizan la extracción de características semánticas más ricas o la optimización de métodos de extracción de relaciones, pasando por alto la importancia de la información posicional y las características del sujeto en esta tarea. Para resolver este problema, presentamos el modelo de extracción de entidades y relaciones basado en la posición del sujeto y el incrustamiento exponencial complejo (SPECE). El módulo codificador de este modelo combina ingeniosamente una red convolucional dilatada inicializada aleatoriamente con un codificador BERT. Destacadamente, determina la posición inicial del sujeto predicho basándose en señales semánticas. Además, logra una integración armoniosa de las características de codificación posicional y las características de texto a través de la adopción del método de incrustamiento exponencial complejo. Los resultados experimentales en los conjuntos de datos NYT y WebNLG revelan que, en comparación con otros modelos de referencia, nuestro modelo propuesto SPECE demuestra mejoras significativas en la puntuación F1 en ambos conjuntos de datos. Esto valida aún más su eficacia y superioridad.