Control de Modo Deslizante Basado en Agentes de Gradiente de Política Determinista Profunda (DDPG) para Actitudes de Cuadricópteros

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Control de Modo Deslizante Basado en Agentes de Gradiente de Política Determinista Profunda (DDPG) para Actitudes de Cuadricópteros

Autores: Hu, Wenjun; Yang, Yueneng; Liu, Zhiyang

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Control de Modo Deslizante Basado en Agentes de Gradiente de Política Determinista Profunda (DDPG) para Actitudes de Cuadricópteros

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Aprendizaje por refuerzo

Gradiente de política determinista profunda

Control por modo deslizante

Quadrotors

Control de actitud

Perturbaciones externas

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

Se propone un enfoque de control por modo deslizante basado en un agente de gradiente de política determinista profunda (DDPG-SMC) para suprimir el fenómeno de chattering en el control de actitud de quadrotors, en presencia de perturbaciones externas. Primero, se deriva el modelo de dinámica de actitud del quadrotor en estudio, y se describe el problema de control de actitud utilizando fórmulas. En segundo lugar, se elige un controlador de modo deslizante, que incluye su superficie de modo deslizante y ley de alcance, para el sistema dinámico no lineal. La estabilidad del sistema SMC diseñado se valida a través del teorema de estabilidad de Lyapunov. En tercer lugar, se entrena un agente de aprendizaje por refuerzo (RL) basado en el gradiente de política determinista profunda (DDPG) para ajustar de manera adaptativa la ganancia de control de conmutación. Durante el proceso de entrenamiento, las señales de entrada para el agente son los ángulos de actitud reales y deseados, mientras que la acción de salida es la ganancia de control variable en el tiempo. Finalmente, se utiliza el agente entrenado mencionado anteriormente en el SMC como un regulador de parámetros para facilitar el ajuste adaptativo de la ganancia de control de conmutación asociada con la ley de alcance. Los resultados de la simulación validan la robustez y efectividad del método DDPG-SMC propuesto.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro