Enfoque basado en gráficos para la sumarización de texto árabe extractivo
Autores: AL-Khassawneh, Yazan Alaya; Hanandeh, Essam Said
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Enfoque basado en gráficos para la sumarización de texto árabe extractivo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Expansión
Procesamiento de texto
Resumen
árabe
Automático
Evaluación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 38
Citaciones: Sin citaciones
Con la notable expansión de fuentes de datos textuales en los últimos años, el procesamiento de texto fácil, rápido y preciso se ha convertido en un desafío para los calificadores clave. La resumen automático de textos es el proceso de comprimir documentos de texto en resúmenes más cortos para facilitar la verificación de sus contenidos básicos, lo cual debe realizarse sin perder información y características vitales. La tarea de recuperación de información más difícil es la resumen de textos, especialmente para el árabe. En esta investigación, ofrecemos un enfoque automático, general y extractivo para la resumen de un solo documento en árabe con el objetivo de proporcionar un resumen suficientemente informativo. El modelo propuesto se basa en un grafo textual para generar un resumen coherente. En primer lugar, el texto original se convierte en un grafo textual utilizando una formulación novedosa que tiene en cuenta la relevancia de las oraciones, la cobertura y la diversidad para evaluar cada oración utilizando una combinación de criterios estadísticos y semánticos. A continuación, se construye un subgrafo para reducir el tamaño del texto original. Finalmente, se eliminan frases no deseadas y menos ponderadas de las oraciones resumidas para generar un resumen final. Utilizamos la Investigación Orientada al Recuerdo para Evaluar la Idea Principal (RED) como métrica de evaluación para revisar nuestra técnica propuesta y compararla con los métodos más avanzados. Finalmente, una prueba en el Corpus de Resúmenes Árabes de Essex (EASC) utilizando el índice ROUGE mostró resultados prometedores en comparación con los métodos actualmente disponibles.
Descripción
Con la notable expansión de fuentes de datos textuales en los últimos años, el procesamiento de texto fácil, rápido y preciso se ha convertido en un desafío para los calificadores clave. La resumen automático de textos es el proceso de comprimir documentos de texto en resúmenes más cortos para facilitar la verificación de sus contenidos básicos, lo cual debe realizarse sin perder información y características vitales. La tarea de recuperación de información más difícil es la resumen de textos, especialmente para el árabe. En esta investigación, ofrecemos un enfoque automático, general y extractivo para la resumen de un solo documento en árabe con el objetivo de proporcionar un resumen suficientemente informativo. El modelo propuesto se basa en un grafo textual para generar un resumen coherente. En primer lugar, el texto original se convierte en un grafo textual utilizando una formulación novedosa que tiene en cuenta la relevancia de las oraciones, la cobertura y la diversidad para evaluar cada oración utilizando una combinación de criterios estadísticos y semánticos. A continuación, se construye un subgrafo para reducir el tamaño del texto original. Finalmente, se eliminan frases no deseadas y menos ponderadas de las oraciones resumidas para generar un resumen final. Utilizamos la Investigación Orientada al Recuerdo para Evaluar la Idea Principal (RED) como métrica de evaluación para revisar nuestra técnica propuesta y compararla con los métodos más avanzados. Finalmente, una prueba en el Corpus de Resúmenes Árabes de Essex (EASC) utilizando el índice ROUGE mostró resultados prometedores en comparación con los métodos actualmente disponibles.