Algoritmo de control basado en aprendizaje por refuerzo óptimo para una clase de sistemas macroeconómicos no lineales
Autores: Ding, Qing; Jahanshahi, Hadi; Wang, Ye; Bekiros, Stelios; Alassafi, Madini O.
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Algoritmo de control basado en aprendizaje por refuerzo óptimo para una clase de sistemas macroeconómicos no lineales
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Sistemas financieros
Estrategias de gestión
Algoritmo de aprendizaje por refuerzo
Sistema macroeconómico
Dinámica no lineal
Acciones óptimas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
Debido al papel vital de los sistemas financieros en el mundo sofisticado actual, aplicar controladores inteligentes a través de estrategias de gestión es de crucial importancia. Proponemos formular el problema de control del sistema macroeconómico como un problema de optimización y encontrar acciones óptimas utilizando un algoritmo de aprendizaje por refuerzo. Mediante el algoritmo Q-learning, se obtiene la mejor acción óptima para el sistema y se controla el comportamiento del sistema. Ilustramos que es posible controlar la dinámica no lineal de los sistemas macroeconómicos utilizando actuación restringida. Se demuestra el rendimiento altamente efectivo del controlador propuesto para sistemas inciertos. Los resultados de la simulación confirman claramente que el controlador propuesto satisface el rendimiento esperado. Además, las simulaciones numéricas confirman claramente que incluso cuando limitamos las acciones de control, el controlador propuesto encuentra de manera efectiva acciones óptimas para el sistema macroeconómico no lineal.
Descripción
Debido al papel vital de los sistemas financieros en el mundo sofisticado actual, aplicar controladores inteligentes a través de estrategias de gestión es de crucial importancia. Proponemos formular el problema de control del sistema macroeconómico como un problema de optimización y encontrar acciones óptimas utilizando un algoritmo de aprendizaje por refuerzo. Mediante el algoritmo Q-learning, se obtiene la mejor acción óptima para el sistema y se controla el comportamiento del sistema. Ilustramos que es posible controlar la dinámica no lineal de los sistemas macroeconómicos utilizando actuación restringida. Se demuestra el rendimiento altamente efectivo del controlador propuesto para sistemas inciertos. Los resultados de la simulación confirman claramente que el controlador propuesto satisface el rendimiento esperado. Además, las simulaciones numéricas confirman claramente que incluso cuando limitamos las acciones de control, el controlador propuesto encuentra de manera efectiva acciones óptimas para el sistema macroeconómico no lineal.