Control óptimo de seguimiento asintótico para sistemas de juego diferencial de suma distinta con dinámicas de deriva desconocidas a través del aprendizaje de refuerzo integral
Autores: Jing, Chonglin; Wang, Chaoli; Song, Hongkai; Shi, Yibo; Hao, Longyan
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Control óptimo de seguimiento asintótico para sistemas de juego diferencial de suma distinta con dinámicas de deriva desconocidas a través del aprendizaje de refuerzo integral
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Aprendizaje por refuerzo integral
Problema de control de seguimiento óptimo
Sistemas de juegos diferenciales no lineales no nulos
Dinámicas de deriva desconocidas
Red neuronal crítica
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
Este estudio emplea un método integral de aprendizaje por refuerzo (IRL) para investigar el problema de control óptimo de seguimiento (OTCP) para sistemas de juegos diferenciales no nulos (NZS) no lineales con dinámicas de deriva desconocidas. A diferencia de los métodos existentes, que solo pueden acotar el error de seguimiento, el enfoque propuesto garantiza que el error de seguimiento converja asintóticamente a cero.
Descripción
Este estudio emplea un método integral de aprendizaje por refuerzo (IRL) para investigar el problema de control óptimo de seguimiento (OTCP) para sistemas de juegos diferenciales no nulos (NZS) no lineales con dinámicas de deriva desconocidas. A diferencia de los métodos existentes, que solo pueden acotar el error de seguimiento, el enfoque propuesto garantiza que el error de seguimiento converja asintóticamente a cero.