Incorporando conocimiento externo en un modelo de grafo no supervisado para resumir documentos

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Incorporando conocimiento externo en un modelo de grafo no supervisado para resumir documentos

Autores: Tang, Tiancheng; Yuan, Tianyi; Tang, Xinhuai; Chen, Delai

Idioma: Inglés

Editor: MDPI

Año: 2020

Descargar PDF

Acceso abierto

Artículo científico

2020

Incorporando conocimiento externo en un modelo de grafo no supervisado para resumir documentos

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Modelos de redes neuronales

Tarea de resumen de documentos

Algoritmo no supervisado Textrank

Datos de entrenamiento etiquetados

Agrupamiento K-means

Grafos de conocimiento

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 21

Citaciones: Sin citaciones

Los modelos supervisados de redes neuronales han logrado un rendimiento sobresaliente en la tarea de resumen de documentos en los últimos años. Sin embargo, es difícil obtener suficientes datos de entrenamiento etiquetados con alta calidad para que estos modelos generen diferentes tipos de resúmenes en la realidad. En este trabajo, nos enfocamos principalmente en mejorar el rendimiento del popular algoritmo no supervisado Textrank que no requiere datos de entrenamiento etiquetados para la sumarización extractiva. Primero modificamos el peso de borde original de Textrank para tener en cuenta la posición relativa de las oraciones, y luego combinamos la salida de Textrank mejorado con el agrupamiento K-means para mejorar la diversidad de los resúmenes generados. Para mejorar aún más el rendimiento de nuestro modelo, incorporamos de manera innovadora conocimiento externo de grafos de conocimiento de código abierto en nuestro modelo mediante enlace de entidades. Utilizamos el embedding de oraciones del grafo de conocimiento y el embedding tf-idf como entrada de nuestro Textrank mejorado, y obtenemos la puntuación final para cada oración mediante combinación lineal. Las evaluaciones en el conjunto de datos del New York Times muestran la efectividad de nuestro enfoque mejorado con conocimiento. El modelo propuesto supera significativamente a otros modelos no supervisados populares.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro