Un marco multiagente mejorado por RL para sistemas de inteligencia empresarial escalables e inteligentes
Autores: Eshankulov, Khamza; Zohirov, Kudratjon; Bakaev, Ilkhom; Tursun, Shafiyev; Shakhzod, Nazarov; Temirov, Zavqiddin; Nasimov, Rashid
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Un marco multiagente mejorado por RL para sistemas de inteligencia empresarial escalables e inteligentes
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Inteligencia empresarial
Informes analíticos
Toma de decisiones operativas
Tuberías de procesamiento centralizadas
Enfoques arquitectónicos alternativos
Marco multiagente
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En muchas organizaciones, los sistemas de inteligencia empresarial apoyan la elaboración de informes analíticos y la toma de decisiones operativas. A medida que los volúmenes de datos crecen y las tareas analíticas se vuelven más complejas, las arquitecturas basadas en tuberías de procesamiento centralizado enfrentan cada vez más limitaciones relacionadas con la escalabilidad y la respuesta oportuna. Estos desafíos motivan el desarrollo de enfoques arquitectónicos alternativos capaces de operar de manera eficiente en entornos intensivos en datos. Este estudio presenta un marco modular de inteligencia empresarial basado en múltiples agentes que distribuye las tareas analíticas entre agentes autónomos y aplica aprendizaje por refuerzo ligero en la etapa de toma de decisiones. El flujo de trabajo analítico se descompone en agentes responsables de la recolección de datos, el preprocesamiento, la modelización analítica y la ejecución de decisiones. La adaptación de decisiones se basa en actualizaciones de políticas localizadas impulsadas por retroalimentación operativa, lo que evita la coordinación de aprendizaje compleja y ayuda a preservar la estabilidad e interpretabilidad del sistema. El marco propuesto se evalúa utilizando datos transaccionales del mundo real de un entorno de comercio electrónico. Los resultados experimentales muestran que el enfoque supera consistentemente a las tuberías analíticas centralizadas y a las líneas base de aprendizaje automático no basadas en agentes en términos de eficiencia de procesamiento, precisión de clasificación y rendimiento de clasificación equilibrado. La evaluación independiente del umbral confirma además un comportamiento discriminativo más fuerte a través de diferentes umbrales de decisión. Además, el análisis de estabilidad a través de ejecuciones experimentales repetidas indica una reducción en la varianza de rendimiento y un comportamiento del sistema más predecible. Estos hallazgos sugieren que el marco de inteligencia empresarial basado en múltiples agentes propuesto proporciona una alternativa práctica y escalable a las arquitecturas analíticas centralizadas para entornos de soporte de decisiones intensivos en datos, manteniendo la robustez y transparencia requeridas en los sistemas empresariales. La evaluación se limita a un solo conjunto de datos y una tarea de clasificación, y los resultados deben interpretarse dentro de este alcance. Los experimentos en el conjunto de datos de comercio minorista en línea (Repositorio de Aprendizaje Automático de UCI) muestran una precisión promedio de 0.89 +/- 0.012 (línea base: 0.74 +/- 0.029) y una latencia de decisión de 94 +/- 9 ms (línea base: 137 +/- 16 ms) en 10 ejecuciones independientes, lo que indica un comportamiento estable bajo ejecución repetida.
Descripción
En muchas organizaciones, los sistemas de inteligencia empresarial apoyan la elaboración de informes analíticos y la toma de decisiones operativas. A medida que los volúmenes de datos crecen y las tareas analíticas se vuelven más complejas, las arquitecturas basadas en tuberías de procesamiento centralizado enfrentan cada vez más limitaciones relacionadas con la escalabilidad y la respuesta oportuna. Estos desafíos motivan el desarrollo de enfoques arquitectónicos alternativos capaces de operar de manera eficiente en entornos intensivos en datos. Este estudio presenta un marco modular de inteligencia empresarial basado en múltiples agentes que distribuye las tareas analíticas entre agentes autónomos y aplica aprendizaje por refuerzo ligero en la etapa de toma de decisiones. El flujo de trabajo analítico se descompone en agentes responsables de la recolección de datos, el preprocesamiento, la modelización analítica y la ejecución de decisiones. La adaptación de decisiones se basa en actualizaciones de políticas localizadas impulsadas por retroalimentación operativa, lo que evita la coordinación de aprendizaje compleja y ayuda a preservar la estabilidad e interpretabilidad del sistema. El marco propuesto se evalúa utilizando datos transaccionales del mundo real de un entorno de comercio electrónico. Los resultados experimentales muestran que el enfoque supera consistentemente a las tuberías analíticas centralizadas y a las líneas base de aprendizaje automático no basadas en agentes en términos de eficiencia de procesamiento, precisión de clasificación y rendimiento de clasificación equilibrado. La evaluación independiente del umbral confirma además un comportamiento discriminativo más fuerte a través de diferentes umbrales de decisión. Además, el análisis de estabilidad a través de ejecuciones experimentales repetidas indica una reducción en la varianza de rendimiento y un comportamiento del sistema más predecible. Estos hallazgos sugieren que el marco de inteligencia empresarial basado en múltiples agentes propuesto proporciona una alternativa práctica y escalable a las arquitecturas analíticas centralizadas para entornos de soporte de decisiones intensivos en datos, manteniendo la robustez y transparencia requeridas en los sistemas empresariales. La evaluación se limita a un solo conjunto de datos y una tarea de clasificación, y los resultados deben interpretarse dentro de este alcance. Los experimentos en el conjunto de datos de comercio minorista en línea (Repositorio de Aprendizaje Automático de UCI) muestran una precisión promedio de 0.89 +/- 0.012 (línea base: 0.74 +/- 0.029) y una latencia de decisión de 94 +/- 9 ms (línea base: 137 +/- 16 ms) en 10 ejecuciones independientes, lo que indica un comportamiento estable bajo ejecución repetida.