logo móvil
Contáctanos

Incorporando conocimiento externo en un modelo de grafo no supervisado para resumir documentos

Autores: Tang, Tiancheng; Yuan, Tianyi; Tang, Xinhuai; Chen, Delai

Idioma: Inglés

Editor: MDPI

Año: 2020

Descargar PDF

Acceso abierto

Artículo científico
2020

Incorporando conocimiento externo en un modelo de grafo no supervisado para resumir documentos


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Modelos de redes neuronales
Tarea de resumen de documentos
Algoritmo no supervisado Textrank
Datos de entrenamiento etiquetados
Agrupamiento K-means
Grafos de conocimiento

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 21

Citaciones: Sin citaciones


Descripción
Los modelos supervisados de redes neuronales han logrado un rendimiento sobresaliente en la tarea de resumen de documentos en los últimos años. Sin embargo, es difícil obtener suficientes datos de entrenamiento etiquetados con alta calidad para que estos modelos generen diferentes tipos de resúmenes en la realidad. En este trabajo, nos enfocamos principalmente en mejorar el rendimiento del popular algoritmo no supervisado Textrank que no requiere datos de entrenamiento etiquetados para la sumarización extractiva. Primero modificamos el peso de borde original de Textrank para tener en cuenta la posición relativa de las oraciones, y luego combinamos la salida de Textrank mejorado con el agrupamiento K-means para mejorar la diversidad de los resúmenes generados. Para mejorar aún más el rendimiento de nuestro modelo, incorporamos de manera innovadora conocimiento externo de grafos de conocimiento de código abierto en nuestro modelo mediante enlace de entidades. Utilizamos el embedding de oraciones del grafo de conocimiento y el embedding tf-idf como entrada de nuestro Textrank mejorado, y obtenemos la puntuación final para cada oración mediante combinación lineal. Las evaluaciones en el conjunto de datos del New York Times muestran la efectividad de nuestro enfoque mejorado con conocimiento. El modelo propuesto supera significativamente a otros modelos no supervisados populares.

Otros recursos que podrían interesarte

Temas Virtualpro