Incorporando conocimiento externo en un modelo de grafo no supervisado para resumir documentos
Autores: Tang, Tiancheng; Yuan, Tianyi; Tang, Xinhuai; Chen, Delai
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Incorporando conocimiento externo en un modelo de grafo no supervisado para resumir documentos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Modelos de redes neuronales
Tarea de resumen de documentos
Algoritmo no supervisado Textrank
Datos de entrenamiento etiquetados
Agrupamiento K-means
Grafos de conocimiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
Los modelos supervisados de redes neuronales han logrado un rendimiento sobresaliente en la tarea de resumen de documentos en los últimos años. Sin embargo, es difícil obtener suficientes datos de entrenamiento etiquetados con alta calidad para que estos modelos generen diferentes tipos de resúmenes en la realidad. En este trabajo, nos enfocamos principalmente en mejorar el rendimiento del popular algoritmo no supervisado Textrank que no requiere datos de entrenamiento etiquetados para la sumarización extractiva. Primero modificamos el peso de borde original de Textrank para tener en cuenta la posición relativa de las oraciones, y luego combinamos la salida de Textrank mejorado con el agrupamiento K-means para mejorar la diversidad de los resúmenes generados. Para mejorar aún más el rendimiento de nuestro modelo, incorporamos de manera innovadora conocimiento externo de grafos de conocimiento de código abierto en nuestro modelo mediante enlace de entidades. Utilizamos el embedding de oraciones del grafo de conocimiento y el embedding tf-idf como entrada de nuestro Textrank mejorado, y obtenemos la puntuación final para cada oración mediante combinación lineal. Las evaluaciones en el conjunto de datos del New York Times muestran la efectividad de nuestro enfoque mejorado con conocimiento. El modelo propuesto supera significativamente a otros modelos no supervisados populares.
Descripción
Los modelos supervisados de redes neuronales han logrado un rendimiento sobresaliente en la tarea de resumen de documentos en los últimos años. Sin embargo, es difícil obtener suficientes datos de entrenamiento etiquetados con alta calidad para que estos modelos generen diferentes tipos de resúmenes en la realidad. En este trabajo, nos enfocamos principalmente en mejorar el rendimiento del popular algoritmo no supervisado Textrank que no requiere datos de entrenamiento etiquetados para la sumarización extractiva. Primero modificamos el peso de borde original de Textrank para tener en cuenta la posición relativa de las oraciones, y luego combinamos la salida de Textrank mejorado con el agrupamiento K-means para mejorar la diversidad de los resúmenes generados. Para mejorar aún más el rendimiento de nuestro modelo, incorporamos de manera innovadora conocimiento externo de grafos de conocimiento de código abierto en nuestro modelo mediante enlace de entidades. Utilizamos el embedding de oraciones del grafo de conocimiento y el embedding tf-idf como entrada de nuestro Textrank mejorado, y obtenemos la puntuación final para cada oración mediante combinación lineal. Las evaluaciones en el conjunto de datos del New York Times muestran la efectividad de nuestro enfoque mejorado con conocimiento. El modelo propuesto supera significativamente a otros modelos no supervisados populares.