Método de vinculación de entidades para texto corto en chino basado en una red tipo siamés
Autores: Zhang, Yang; Liu, Jin; Huang, Bo; Chen, Bei
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Método de vinculación de entidades para texto corto en chino basado en una red tipo siamés
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Vinculación de entidades
Ingeniería del conocimiento
Minería de datos
Desambiguación de entidades
Redes similares a Siamés
Mecanismo de atención
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El enlace de entidades juega un papel fundamental en la ingeniería del conocimiento y la minería de datos y es la base de diversas aplicaciones posteriores, como el análisis de contenido, la extracción de relaciones y las preguntas y respuestas. La mayoría de los modelos de enlace de entidades existentes dependen de un contexto suficiente para la desambiguación, pero no funcionan bien para textos cortos concisos y escasos. Además, la mayoría de los métodos utilizan modelos de preentrenamiento para calcular directamente la similitud entre el texto de la entidad que se va a desambiguar y el texto de la entidad candidata, y no profundizan en la relación entre ellos. Este artículo propone un método de enlace de entidades para textos cortos en chino basado en redes similares a Siamés para abordar las deficiencias mencionadas. En la tarea de desambiguación de entidades, se utilizan las características de la red similar a Siamés para analizar profundamente las relaciones semánticas en el texto y aprovechar al máximo la información de características del texto de la entidad que se va a desambiguar, capturando las características interdependientes dentro de las oraciones a través de un mecanismo de atención, con el objetivo de encontrar los elementos más críticos en la descripción del texto de la entidad. La demostración experimental en el conjunto de datos CCKS2019 muestra que el valor F1 del método alcanza el 87.29%, un aumento del 11.02% en comparación con el valor F1 del método base, validando plenamente la superioridad del modelo.
Descripción
El enlace de entidades juega un papel fundamental en la ingeniería del conocimiento y la minería de datos y es la base de diversas aplicaciones posteriores, como el análisis de contenido, la extracción de relaciones y las preguntas y respuestas. La mayoría de los modelos de enlace de entidades existentes dependen de un contexto suficiente para la desambiguación, pero no funcionan bien para textos cortos concisos y escasos. Además, la mayoría de los métodos utilizan modelos de preentrenamiento para calcular directamente la similitud entre el texto de la entidad que se va a desambiguar y el texto de la entidad candidata, y no profundizan en la relación entre ellos. Este artículo propone un método de enlace de entidades para textos cortos en chino basado en redes similares a Siamés para abordar las deficiencias mencionadas. En la tarea de desambiguación de entidades, se utilizan las características de la red similar a Siamés para analizar profundamente las relaciones semánticas en el texto y aprovechar al máximo la información de características del texto de la entidad que se va a desambiguar, capturando las características interdependientes dentro de las oraciones a través de un mecanismo de atención, con el objetivo de encontrar los elementos más críticos en la descripción del texto de la entidad. La demostración experimental en el conjunto de datos CCKS2019 muestra que el valor F1 del método alcanza el 87.29%, un aumento del 11.02% en comparación con el valor F1 del método base, validando plenamente la superioridad del modelo.