Vinculación conjunta de entidades basada en atención con incrustación de entidades
Autores: Liu, Chen; Li, Feng; Sun, Xian; Han, Hongzhe
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Vinculación conjunta de entidades basada en atención con incrustación de entidades
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Vinculación de entidades
Menciones
Base de conocimientos
LSTM
Mecanismo de atención
Coherencia
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El enlace de entidades (también llamado desambiguación de entidades) tiene como objetivo mapear las menciones en un documento dado a sus entidades correspondientes en una base de conocimiento objetivo. Para construir un sistema de enlace de entidades de alta calidad, se realizan esfuerzos en tres partes: codificación de la entidad, codificación del contexto de la mención y modelado de la coherencia entre menciones. Para la codificación de la entidad, utilizamos memoria a corto y largo plazo (LSTM) y una red neuronal convolucional (CNN) para codificar el contexto de la entidad y la descripción de la entidad, respectivamente. Luego, diseñamos una función para combinar todos los diferentes aspectos de información de la entidad, con el fin de generar incrustaciones de entidad unificadas y densas. Para la codificación del contexto de la mención, a diferencia de los mecanismos de atención estándar que solo pueden capturar palabras individuales importantes, introducimos un novedoso modelo LSTM basado en mecanismos de atención, que puede capturar de manera efectiva los tramos de texto importantes alrededor de una mención dada con una capa de campo aleatorio condicional (CRF). Además, tomamos en consideración la coherencia entre menciones con un Algoritmo de Adelante-Atrás, que es menos costoso en tiempo que los métodos anteriores. Nuestros resultados experimentales muestran que nuestro modelo obtiene un rendimiento competitivo, o incluso mejor, que los modelos de última generación en diferentes conjuntos de datos.
Descripción
El enlace de entidades (también llamado desambiguación de entidades) tiene como objetivo mapear las menciones en un documento dado a sus entidades correspondientes en una base de conocimiento objetivo. Para construir un sistema de enlace de entidades de alta calidad, se realizan esfuerzos en tres partes: codificación de la entidad, codificación del contexto de la mención y modelado de la coherencia entre menciones. Para la codificación de la entidad, utilizamos memoria a corto y largo plazo (LSTM) y una red neuronal convolucional (CNN) para codificar el contexto de la entidad y la descripción de la entidad, respectivamente. Luego, diseñamos una función para combinar todos los diferentes aspectos de información de la entidad, con el fin de generar incrustaciones de entidad unificadas y densas. Para la codificación del contexto de la mención, a diferencia de los mecanismos de atención estándar que solo pueden capturar palabras individuales importantes, introducimos un novedoso modelo LSTM basado en mecanismos de atención, que puede capturar de manera efectiva los tramos de texto importantes alrededor de una mención dada con una capa de campo aleatorio condicional (CRF). Además, tomamos en consideración la coherencia entre menciones con un Algoritmo de Adelante-Atrás, que es menos costoso en tiempo que los métodos anteriores. Nuestros resultados experimentales muestran que nuestro modelo obtiene un rendimiento competitivo, o incluso mejor, que los modelos de última generación en diferentes conjuntos de datos.