Control de Modo Deslizante Basado en Agentes de Gradiente de Política Determinista Profunda (DDPG) para Actitudes de Cuadricópteros
Autores: Hu, Wenjun; Yang, Yueneng; Liu, Zhiyang
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Control de Modo Deslizante Basado en Agentes de Gradiente de Política Determinista Profunda (DDPG) para Actitudes de Cuadricópteros
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Aprendizaje por refuerzo
Gradiente de política determinista profunda
Control por modo deslizante
Quadrotors
Control de actitud
Perturbaciones externas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Se propone un enfoque de control por modo deslizante basado en un agente de gradiente de política determinista profunda (DDPG-SMC) para suprimir el fenómeno de chattering en el control de actitud de quadrotors, en presencia de perturbaciones externas. Primero, se deriva el modelo de dinámica de actitud del quadrotor en estudio, y se describe el problema de control de actitud utilizando fórmulas. En segundo lugar, se elige un controlador de modo deslizante, que incluye su superficie de modo deslizante y ley de alcance, para el sistema dinámico no lineal. La estabilidad del sistema SMC diseñado se valida a través del teorema de estabilidad de Lyapunov. En tercer lugar, se entrena un agente de aprendizaje por refuerzo (RL) basado en el gradiente de política determinista profunda (DDPG) para ajustar de manera adaptativa la ganancia de control de conmutación. Durante el proceso de entrenamiento, las señales de entrada para el agente son los ángulos de actitud reales y deseados, mientras que la acción de salida es la ganancia de control variable en el tiempo. Finalmente, se utiliza el agente entrenado mencionado anteriormente en el SMC como un regulador de parámetros para facilitar el ajuste adaptativo de la ganancia de control de conmutación asociada con la ley de alcance. Los resultados de la simulación validan la robustez y efectividad del método DDPG-SMC propuesto.
Descripción
Se propone un enfoque de control por modo deslizante basado en un agente de gradiente de política determinista profunda (DDPG-SMC) para suprimir el fenómeno de chattering en el control de actitud de quadrotors, en presencia de perturbaciones externas. Primero, se deriva el modelo de dinámica de actitud del quadrotor en estudio, y se describe el problema de control de actitud utilizando fórmulas. En segundo lugar, se elige un controlador de modo deslizante, que incluye su superficie de modo deslizante y ley de alcance, para el sistema dinámico no lineal. La estabilidad del sistema SMC diseñado se valida a través del teorema de estabilidad de Lyapunov. En tercer lugar, se entrena un agente de aprendizaje por refuerzo (RL) basado en el gradiente de política determinista profunda (DDPG) para ajustar de manera adaptativa la ganancia de control de conmutación. Durante el proceso de entrenamiento, las señales de entrada para el agente son los ángulos de actitud reales y deseados, mientras que la acción de salida es la ganancia de control variable en el tiempo. Finalmente, se utiliza el agente entrenado mencionado anteriormente en el SMC como un regulador de parámetros para facilitar el ajuste adaptativo de la ganancia de control de conmutación asociada con la ley de alcance. Los resultados de la simulación validan la robustez y efectividad del método DDPG-SMC propuesto.