Control de Seguimiento de Trayectorias de Curvas Óptimas Aproximadas para Sistemas No Lineales con Restricciones de Entrada Asimétricas
Autores: Wang, Yajing; Wang, Xiangke; Shen, Lincheng
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Control de Seguimiento de Trayectorias de Curvas Óptimas Aproximadas para Sistemas No Lineales con Restricciones de Entrada Asimétricas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Propuestas
Control de seguimiento de trayectoria curva
Sistemas no lineales
Restricciones de entrada de control asimétricas
Control óptimo
Aprendizaje por refuerzo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Este documento propone un algoritmo de control de seguimiento de trayectoria óptimo aproximado para sistemas no lineales parcialmente desconocidos sujetos a restricciones asimétricas de entrada de control. En primer lugar, el problema se simplifica al introducir una ley de control de avance, y se proporciona un diseño dedicado para el control óptimo con restricciones de entrada asimétricas al rediseñar la función de costo de control en una forma no cuadrática. Luego, se demuestra la optimalidad y estabilidad de la política de control óptimo derivada. Para resolver la ecuación de Hamilton-Jacobi-Bellman (HJB) de seguimiento subyacente considerando sistemas parcialmente desconocidos, se utiliza un algoritmo de aprendizaje por refuerzo integral (IRL) utilizando la aproximación de función de valor basada en redes neuronales (NN). Finalmente, se verifica la efectividad y generalización del método propuesto mediante experimentos realizados en un sistema de simulación de hardware en el lazo (HIL) de alta fidelidad para vehículos aéreos no tripulados (UAV) en comparación con tres otros algoritmos típicos de control de seguimiento de trayectoria.
Descripción
Este documento propone un algoritmo de control de seguimiento de trayectoria óptimo aproximado para sistemas no lineales parcialmente desconocidos sujetos a restricciones asimétricas de entrada de control. En primer lugar, el problema se simplifica al introducir una ley de control de avance, y se proporciona un diseño dedicado para el control óptimo con restricciones de entrada asimétricas al rediseñar la función de costo de control en una forma no cuadrática. Luego, se demuestra la optimalidad y estabilidad de la política de control óptimo derivada. Para resolver la ecuación de Hamilton-Jacobi-Bellman (HJB) de seguimiento subyacente considerando sistemas parcialmente desconocidos, se utiliza un algoritmo de aprendizaje por refuerzo integral (IRL) utilizando la aproximación de función de valor basada en redes neuronales (NN). Finalmente, se verifica la efectividad y generalización del método propuesto mediante experimentos realizados en un sistema de simulación de hardware en el lazo (HIL) de alta fidelidad para vehículos aéreos no tripulados (UAV) en comparación con tres otros algoritmos típicos de control de seguimiento de trayectoria.