Atención Multinivel con Relleno de Tabla 2D para la Extracción Conjunta de Entidades y Relaciones
Autores: Zhang, Zhenyu; Shi, Lin; Yuan, Yang; Zhou, Huanyue; Xu, Shoukun
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Atención Multinivel con Relleno de Tabla 2D para la Extracción Conjunta de Entidades y Relaciones
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Extracción de entidades y relaciones
Grafos de conocimiento
Semántica
Método de etiquetado de pares de palabras
Red neuronal de atención
Conjuntos de datos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La extracción conjunta de entidades y relaciones es una tarea fundamental en la construcción de gráficos de conocimiento a gran escala. Esta tarea se basa no solo en la semántica del fragmento de texto, sino también en sus intrincadas conexiones, incluyendo la clasificación y los detalles estructurales que la mayoría de los modelos anteriores pasan por alto. En este artículo, proponemos la incorporación de esta información en el proceso de aprendizaje. Específicamente, diseñamos un novedoso método de etiquetado de pares de palabras en dos dimensiones para definir la tarea de extracción de entidades y relaciones. Esto permite que los marcadores de tipo se centren en los tokens de texto, recopilando información para sus fragmentos correspondientes. Además, introducimos una red neuronal de atención multinivel para mejorar su capacidad de percibir características conscientes de la estructura. Nuestros experimentos muestran que nuestro enfoque puede superar las limitaciones de los métodos de etiquetado anteriores y producir resultados más precisos. Evaluamos nuestro modelo utilizando tres conjuntos de datos diferentes: SciERC, ADE y CoNLL04. Nuestro modelo demuestra un rendimiento competitivo en comparación con el estado del arte, superando otros enfoques en la mayoría de las métricas evaluadas.
Descripción
La extracción conjunta de entidades y relaciones es una tarea fundamental en la construcción de gráficos de conocimiento a gran escala. Esta tarea se basa no solo en la semántica del fragmento de texto, sino también en sus intrincadas conexiones, incluyendo la clasificación y los detalles estructurales que la mayoría de los modelos anteriores pasan por alto. En este artículo, proponemos la incorporación de esta información en el proceso de aprendizaje. Específicamente, diseñamos un novedoso método de etiquetado de pares de palabras en dos dimensiones para definir la tarea de extracción de entidades y relaciones. Esto permite que los marcadores de tipo se centren en los tokens de texto, recopilando información para sus fragmentos correspondientes. Además, introducimos una red neuronal de atención multinivel para mejorar su capacidad de percibir características conscientes de la estructura. Nuestros experimentos muestran que nuestro enfoque puede superar las limitaciones de los métodos de etiquetado anteriores y producir resultados más precisos. Evaluamos nuestro modelo utilizando tres conjuntos de datos diferentes: SciERC, ADE y CoNLL04. Nuestro modelo demuestra un rendimiento competitivo en comparación con el estado del arte, superando otros enfoques en la mayoría de las métricas evaluadas.