Multi-document news web page summarization using content extraction and lexical chain based key phrase extraction
Autores: Arya, Chandrakala; Diwakar, Manoj; Singh, Prabhishek; Singh, Vijendra; Kadry, Seifedine; Kim, Jungeun
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Multi-document news web page summarization using content extraction and lexical chain based key phrase extraction
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Resumen de texto
Resumen de noticias
Enfoque de síntesis
Clasificación de oraciones
Resúmenes de varios documentos
Modelos de similitud
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
En el área de resumen de textos, ha habido avances significativos recientemente. Mientras tanto, la tendencia actual en resumen de textos se centra más en la síntesis de noticias. Por lo tanto, desarrollar un enfoque de síntesis capaz de extraer, comparar y clasificar oraciones es vital para crear un resumen de varios artículos de noticias en el contexto de datos erróneos en línea. Sin embargo, es necesario que el sistema de resumen de noticias pueda manejar resúmenes de varios documentos debido a la redundancia de contenido. Este documento presenta un método para resumir páginas web de noticias de varios documentos basado en modelos de similitud y clasificación de oraciones, donde se extraen oraciones relevantes del artículo original. Se recopilan artículos en inglés de cinco sitios web de noticias que cubren el mismo tema y evento. Según nuestros resultados experimentales, nuestro enfoque proporciona mejores resultados que otros métodos recientes para resumir noticias.
Descripción
En el área de resumen de textos, ha habido avances significativos recientemente. Mientras tanto, la tendencia actual en resumen de textos se centra más en la síntesis de noticias. Por lo tanto, desarrollar un enfoque de síntesis capaz de extraer, comparar y clasificar oraciones es vital para crear un resumen de varios artículos de noticias en el contexto de datos erróneos en línea. Sin embargo, es necesario que el sistema de resumen de noticias pueda manejar resúmenes de varios documentos debido a la redundancia de contenido. Este documento presenta un método para resumir páginas web de noticias de varios documentos basado en modelos de similitud y clasificación de oraciones, donde se extraen oraciones relevantes del artículo original. Se recopilan artículos en inglés de cinco sitios web de noticias que cubren el mismo tema y evento. Según nuestros resultados experimentales, nuestro enfoque proporciona mejores resultados que otros métodos recientes para resumir noticias.