Control de Seguimiento de Trayectorias Crítico para la Seguridad con Aprendizaje por Refuerzo Mejorado en Seguridad para Vehículos Submarinos Autónomos
Autores: Li, Tianli; Tao, Jiaming; Hu, Yu; Chen, Shiyu; Wei, Yue; Zhang, Bo
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Control de Seguimiento de Trayectorias Crítico para la Seguridad con Aprendizaje por Refuerzo Mejorado en Seguridad para Vehículos Submarinos Autónomos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Aprendizaje por refuerzo
Programación cuadrática
Vehículos autónomos submarinos
Incertidumbre del modelo
Control de seguimiento de trayectoria
Crítico para la seguridad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Este artículo investiga un nuevo método de programación cuadrática (QP) basado en el aprendizaje por refuerzo (RL) para el control de seguimiento de trayectoria crítico para la seguridad de vehículos autónomos submarinos (AUV). El enfoque propuesto aborda el desafío sustancial que plantea la incertidumbre del modelo, que puede obstaculizar la seguridad y el rendimiento de los AUV que operan en entornos submarinos complejos. El marco de RL puede aprender las incertidumbres inherentes del modelo que afectan las restricciones en las Funciones de Barrera de Control (CBFs) y las Funciones de Lyapunov de Control (CLFs). Estas incertidumbres aprendidas se integran posteriormente para formular un nuevo controlador de Programación Cuadrática RL-CBF-CLF (RL-CBF-CLF-QP). Se demuestran simulaciones correspondientes bajo diversos escenarios de seguimiento de trayectoria con altos niveles de incertidumbre del modelo. Los resultados de la simulación muestran que el controlador propuesto RL-CBF-CLF-QP puede mejorar significativamente la seguridad y la precisión del rendimiento de seguimiento del AUV.
Descripción
Este artículo investiga un nuevo método de programación cuadrática (QP) basado en el aprendizaje por refuerzo (RL) para el control de seguimiento de trayectoria crítico para la seguridad de vehículos autónomos submarinos (AUV). El enfoque propuesto aborda el desafío sustancial que plantea la incertidumbre del modelo, que puede obstaculizar la seguridad y el rendimiento de los AUV que operan en entornos submarinos complejos. El marco de RL puede aprender las incertidumbres inherentes del modelo que afectan las restricciones en las Funciones de Barrera de Control (CBFs) y las Funciones de Lyapunov de Control (CLFs). Estas incertidumbres aprendidas se integran posteriormente para formular un nuevo controlador de Programación Cuadrática RL-CBF-CLF (RL-CBF-CLF-QP). Se demuestran simulaciones correspondientes bajo diversos escenarios de seguimiento de trayectoria con altos niveles de incertidumbre del modelo. Los resultados de la simulación muestran que el controlador propuesto RL-CBF-CLF-QP puede mejorar significativamente la seguridad y la precisión del rendimiento de seguimiento del AUV.