logo móvil
Contáctanos

Control de Modo Deslizante Basado en Agentes de Gradiente de Política Determinista Profunda (DDPG) para Actitudes de Cuadricópteros

Autores: Hu, Wenjun; Yang, Yueneng; Liu, Zhiyang

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Control de Modo Deslizante Basado en Agentes de Gradiente de Política Determinista Profunda (DDPG) para Actitudes de Cuadricópteros


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Aprendizaje por refuerzo
Gradiente de política determinista profunda
Control por modo deslizante
Quadrotors
Control de actitud
Perturbaciones externas

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Se propone un enfoque de control por modo deslizante basado en un agente de gradiente de política determinista profunda (DDPG-SMC) para suprimir el fenómeno de chattering en el control de actitud de quadrotors, en presencia de perturbaciones externas. Primero, se deriva el modelo de dinámica de actitud del quadrotor en estudio, y se describe el problema de control de actitud utilizando fórmulas. En segundo lugar, se elige un controlador de modo deslizante, que incluye su superficie de modo deslizante y ley de alcance, para el sistema dinámico no lineal. La estabilidad del sistema SMC diseñado se valida a través del teorema de estabilidad de Lyapunov. En tercer lugar, se entrena un agente de aprendizaje por refuerzo (RL) basado en el gradiente de política determinista profunda (DDPG) para ajustar de manera adaptativa la ganancia de control de conmutación. Durante el proceso de entrenamiento, las señales de entrada para el agente son los ángulos de actitud reales y deseados, mientras que la acción de salida es la ganancia de control variable en el tiempo. Finalmente, se utiliza el agente entrenado mencionado anteriormente en el SMC como un regulador de parámetros para facilitar el ajuste adaptativo de la ganancia de control de conmutación asociada con la ley de alcance. Los resultados de la simulación validan la robustez y efectividad del método DDPG-SMC propuesto.

Otros recursos que podrían interesarte

Temas Virtualpro