Optimización de Hiperparámetros de Caja Negra para la Recuperación RAG Financiera: Un Estudio de Compensación entre Eficiencia y Efectividad
Autores: Jin, Yangyang; Wang, Xindi; Dong, Qianli
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Optimización de Hiperparámetros de Caja Negra para la Recuperación RAG Financiera: Un Estudio de Compensación entre Eficiencia y Efectividad
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Estudio
Optimización de hiperparámetros de caja negra
Generación aumentada por recuperación financiera
Restricciones de presupuesto limitado
Búsqueda en cuadrícula
Búsqueda aleatoria
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Este estudio examina la optimización de hiperparámetros de caja negra para la generación aumentada por recuperación (RAG) en finanzas bajo restricciones de presupuesto limitadas. Utilizando FinQA como el conjunto de datos principal, compara la Búsqueda en Cuadrícula, la Búsqueda Aleatoria y la Optimización Bayesiana bajo un espacio de búsqueda unificado, un protocolo de evaluación y un entorno de múltiples semillas, y utiliza FinanceBench para la validación externa. Los resultados muestran que la Búsqueda Aleatoria y la Optimización Bayesiana pueden acercarse a la referencia de la Cuadrícula a un costo sustancialmente menor, pero la pequeña ventaja del conjunto de desarrollo de la Optimización Bayesiana no se mantiene estable en el conjunto de prueba ni en ejecuciones repetidas. Un hallazgo más consistente es que las configuraciones de alto rendimiento están concentradas en una región de parámetros limitada. En general, los resultados sugieren que, en la sintonización de RAG financiera con restricciones de presupuesto, identificar regiones de parámetros de alto rendimiento estables puede ser más útil que depender de métodos de optimización cada vez más complejos.
Descripción
Este estudio examina la optimización de hiperparámetros de caja negra para la generación aumentada por recuperación (RAG) en finanzas bajo restricciones de presupuesto limitadas. Utilizando FinQA como el conjunto de datos principal, compara la Búsqueda en Cuadrícula, la Búsqueda Aleatoria y la Optimización Bayesiana bajo un espacio de búsqueda unificado, un protocolo de evaluación y un entorno de múltiples semillas, y utiliza FinanceBench para la validación externa. Los resultados muestran que la Búsqueda Aleatoria y la Optimización Bayesiana pueden acercarse a la referencia de la Cuadrícula a un costo sustancialmente menor, pero la pequeña ventaja del conjunto de desarrollo de la Optimización Bayesiana no se mantiene estable en el conjunto de prueba ni en ejecuciones repetidas. Un hallazgo más consistente es que las configuraciones de alto rendimiento están concentradas en una región de parámetros limitada. En general, los resultados sugieren que, en la sintonización de RAG financiera con restricciones de presupuesto, identificar regiones de parámetros de alto rendimiento estables puede ser más útil que depender de métodos de optimización cada vez más complejos.