TSQA: Integrando la Resumición de Texto y la Respuesta a Preguntas para Mejorar la Recuperación de Información de Documentos Usando Generación Aumentada por Recuperación
Autores: Jaddoa, Ahmed Sami; Karimpour, Jaber; Salehpour, Pedram
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
TSQA: Integrando la Resumición de Texto y la Respuesta a Preguntas para Mejorar la Recuperación de Información de Documentos Usando Generación Aumentada por Recuperación
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Sistema propuesto
Resumen de texto
Respuesta a preguntas
Proceso de IR
SBERT
Método RAG
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Aquí, proponemos un sistema compuesto que utiliza la resumición de texto (TS) y la respuesta a preguntas (QA) para complementar el proceso de recuperación de información (IR) de documentos largos. La mayoría de los estudios anteriores han utilizado enfoques separados, es decir, ya sea TS o QA. El objetivo de este artículo es desarrollar una interacción entre TS y QA en tres etapas para mejorar el rendimiento de IR. Primero, se utiliza SBERT para la resumición. En segundo lugar, se emplea un método RAG para recuperar información y generar respuestas. En la arquitectura de RAG, la recuperación del documento se realiza a través de all-MiniLM-L6-v2, mientras que la generación de respuestas se lleva a cabo mediante los modelos T5 y BART-large-cnn. En tercer lugar, las respuestas recuperadas se evalúan y comparan con un sistema base en el que los documentos se tratan sin resumición. El sistema propuesto tiene como objetivo mejorar la calidad de la información recuperada y la precisión de las respuestas generadas por TSQA en un flujo de trabajo unificado. La evaluación experimental realizada en el conjunto de datos NIPS demuestra que el enfoque propuesto mejora significativamente la informatividad del resumen y la precisión de las respuestas en comparación con los enfoques tradicionales de tarea única. Los resultados de la simulación muestran mejoras del 20.83% en similitud de texto y del 2.38% en las puntuaciones de BERT para la generación de respuestas en comparación con la línea base estándar de RAG sin resumición.
Descripción
Aquí, proponemos un sistema compuesto que utiliza la resumición de texto (TS) y la respuesta a preguntas (QA) para complementar el proceso de recuperación de información (IR) de documentos largos. La mayoría de los estudios anteriores han utilizado enfoques separados, es decir, ya sea TS o QA. El objetivo de este artículo es desarrollar una interacción entre TS y QA en tres etapas para mejorar el rendimiento de IR. Primero, se utiliza SBERT para la resumición. En segundo lugar, se emplea un método RAG para recuperar información y generar respuestas. En la arquitectura de RAG, la recuperación del documento se realiza a través de all-MiniLM-L6-v2, mientras que la generación de respuestas se lleva a cabo mediante los modelos T5 y BART-large-cnn. En tercer lugar, las respuestas recuperadas se evalúan y comparan con un sistema base en el que los documentos se tratan sin resumición. El sistema propuesto tiene como objetivo mejorar la calidad de la información recuperada y la precisión de las respuestas generadas por TSQA en un flujo de trabajo unificado. La evaluación experimental realizada en el conjunto de datos NIPS demuestra que el enfoque propuesto mejora significativamente la informatividad del resumen y la precisión de las respuestas en comparación con los enfoques tradicionales de tarea única. Los resultados de la simulación muestran mejoras del 20.83% en similitud de texto y del 2.38% en las puntuaciones de BERT para la generación de respuestas en comparación con la línea base estándar de RAG sin resumición.