logo móvil
Contáctanos

Enfoque basado en gráficos para la sumarización de texto árabe extractivo

Autores: AL-Khassawneh, Yazan Alaya; Hanandeh, Essam Said

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Enfoque basado en gráficos para la sumarización de texto árabe extractivo


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Expansión
Procesamiento de texto
Resumen
árabe
Automático
Evaluación

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 38

Citaciones: Sin citaciones


Descripción
Con la notable expansión de fuentes de datos textuales en los últimos años, el procesamiento de texto fácil, rápido y preciso se ha convertido en un desafío para los calificadores clave. La resumen automático de textos es el proceso de comprimir documentos de texto en resúmenes más cortos para facilitar la verificación de sus contenidos básicos, lo cual debe realizarse sin perder información y características vitales. La tarea de recuperación de información más difícil es la resumen de textos, especialmente para el árabe. En esta investigación, ofrecemos un enfoque automático, general y extractivo para la resumen de un solo documento en árabe con el objetivo de proporcionar un resumen suficientemente informativo. El modelo propuesto se basa en un grafo textual para generar un resumen coherente. En primer lugar, el texto original se convierte en un grafo textual utilizando una formulación novedosa que tiene en cuenta la relevancia de las oraciones, la cobertura y la diversidad para evaluar cada oración utilizando una combinación de criterios estadísticos y semánticos. A continuación, se construye un subgrafo para reducir el tamaño del texto original. Finalmente, se eliminan frases no deseadas y menos ponderadas de las oraciones resumidas para generar un resumen final. Utilizamos la Investigación Orientada al Recuerdo para Evaluar la Idea Principal (RED) como métrica de evaluación para revisar nuestra técnica propuesta y compararla con los métodos más avanzados. Finalmente, una prueba en el Corpus de Resúmenes Árabes de Essex (EASC) utilizando el índice ROUGE mostró resultados prometedores en comparación con los métodos actualmente disponibles.

Otros recursos que podrían interesarte

Temas Virtualpro