Un marco para generar resúmenes extractivos a partir de múltiples documentos en malayalam
Autores: Manju, K.; David Peter, S.; Idicula, Sumam Mary
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Un marco para generar resúmenes extractivos a partir de múltiples documentos en malayalam
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Resumen automático
Resumen de texto
Documentos
Resumen
Múltiples
Oraciones
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La resumición automática extractiva de texto recupera un subconjunto de datos que representa las oraciones más notables en todo el documento. En la era de la explosión digital, que consiste principalmente en datos textuales no estructurados, existe una demanda de los usuarios para entender la gran cantidad de texto en poco tiempo; esto exige la necesidad de un resumidor automático de texto. A partir de los resúmenes, los usuarios obtienen la idea del contenido completo del documento y pueden decidir si leer el documento completo o no. Este trabajo se centra principalmente en generar un resumen a partir de múltiples documentos de noticias. En este caso, el resumen ayuda a reducir las noticias redundantes de los diferentes periódicos. Un resumen de múltiples documentos es más desafiante que un resumen de un solo documento, ya que tiene que resolver el problema de la información superpuesta entre oraciones de diferentes documentos. La resumición extractiva de texto produce la parte sensible del documento al ignorar las oraciones irrelevantes y redundantes. En este artículo, proponemos un marco para extraer un resumen de múltiples documentos en el idioma malayalam. Además, dado que el conjunto de datos de resumición de múltiples documentos es escaso, los métodos basados en aprendizaje profundo son difíciles de aplicar. El trabajo propuesto discute el rendimiento de los algoritmos estándar existentes en la resumición de múltiples documentos en el idioma malayalam. Proponemos un algoritmo de extracción de oraciones que selecciona las oraciones mejor clasificadas con la máxima diversidad. Se ha encontrado que el sistema funciona bien en términos de precisión, recuperación y medida F en múltiples documentos de entrada.
Descripción
La resumición automática extractiva de texto recupera un subconjunto de datos que representa las oraciones más notables en todo el documento. En la era de la explosión digital, que consiste principalmente en datos textuales no estructurados, existe una demanda de los usuarios para entender la gran cantidad de texto en poco tiempo; esto exige la necesidad de un resumidor automático de texto. A partir de los resúmenes, los usuarios obtienen la idea del contenido completo del documento y pueden decidir si leer el documento completo o no. Este trabajo se centra principalmente en generar un resumen a partir de múltiples documentos de noticias. En este caso, el resumen ayuda a reducir las noticias redundantes de los diferentes periódicos. Un resumen de múltiples documentos es más desafiante que un resumen de un solo documento, ya que tiene que resolver el problema de la información superpuesta entre oraciones de diferentes documentos. La resumición extractiva de texto produce la parte sensible del documento al ignorar las oraciones irrelevantes y redundantes. En este artículo, proponemos un marco para extraer un resumen de múltiples documentos en el idioma malayalam. Además, dado que el conjunto de datos de resumición de múltiples documentos es escaso, los métodos basados en aprendizaje profundo son difíciles de aplicar. El trabajo propuesto discute el rendimiento de los algoritmos estándar existentes en la resumición de múltiples documentos en el idioma malayalam. Proponemos un algoritmo de extracción de oraciones que selecciona las oraciones mejor clasificadas con la máxima diversidad. Se ha encontrado que el sistema funciona bien en términos de precisión, recuperación y medida F en múltiples documentos de entrada.