Knowledge-enhanced transformer graph summarization (KETGS): integrando relaciones de entidad y discurso para una avanzada sumarización extractiva de texto
Autores: Onan, Aytu; Alhumyani, Hesham
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Knowledge-enhanced transformer graph summarization (KETGS): integrando relaciones de entidad y discurso para una avanzada sumarización extractiva de texto
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Proliferación
Datos textuales
Resumir
Resumen de texto extractivo
Modelos transformadores
Redes neuronales gráficas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
La rápida proliferación de datos textuales en múltiples sectores demanda técnicas más sofisticadas y eficientes para resumir textos extensos. Enfocándose en la sumarización extractiva de texto, este enfoque se centra en elegir frases clave de un documento, proporcionando un método esencial para manejar información extensa. Mientras que los métodos convencionales a menudo no logran capturar vínculos semánticos profundos dentro de los textos, lo que resulta en resúmenes que podrían carecer de cohesión y profundidad, este documento presenta un marco novedoso llamado Resumen de Grafo de Transformador Mejorado con Conocimiento (KETGS). Aprovechando las fortalezas de los modelos de transformador y las Redes Neuronales de Grafo, KETGS desarrolla una representación detallada de grafo de documentos, incrustando unidades lingüísticas desde palabras hasta entidades clave. Este grafo estructurado es luego navegado a través de una Red Neuronal de Grafo Guiada por Transformador (TG-GNN), mejorando dinámicamente las características de los nodos con conexiones estructurales y mecanismos de atención impulsados por transformadores. El marco adopta una estrategia de Máxima Relevancia Marginal (MMR) para seleccionar frases. Nuestras evaluaciones muestran que KETGS supera a otros modelos líderes de sumarización extractiva, entregando resúmenes más relevantes, cohesivos y concisos, preservando así mejor la esencia y estructura de los textos originales.
Descripción
La rápida proliferación de datos textuales en múltiples sectores demanda técnicas más sofisticadas y eficientes para resumir textos extensos. Enfocándose en la sumarización extractiva de texto, este enfoque se centra en elegir frases clave de un documento, proporcionando un método esencial para manejar información extensa. Mientras que los métodos convencionales a menudo no logran capturar vínculos semánticos profundos dentro de los textos, lo que resulta en resúmenes que podrían carecer de cohesión y profundidad, este documento presenta un marco novedoso llamado Resumen de Grafo de Transformador Mejorado con Conocimiento (KETGS). Aprovechando las fortalezas de los modelos de transformador y las Redes Neuronales de Grafo, KETGS desarrolla una representación detallada de grafo de documentos, incrustando unidades lingüísticas desde palabras hasta entidades clave. Este grafo estructurado es luego navegado a través de una Red Neuronal de Grafo Guiada por Transformador (TG-GNN), mejorando dinámicamente las características de los nodos con conexiones estructurales y mecanismos de atención impulsados por transformadores. El marco adopta una estrategia de Máxima Relevancia Marginal (MMR) para seleccionar frases. Nuestras evaluaciones muestran que KETGS supera a otros modelos líderes de sumarización extractiva, entregando resúmenes más relevantes, cohesivos y concisos, preservando así mejor la esencia y estructura de los textos originales.