Control Adaptativo Basado en DDPG con Modo de Deslizamiento y Observador de Estado Extendida para Sistemas de Robots Multicuerpo
Autores: Khan, Hamza; Khan, Sheraz Ali; Lee, Min Cheol; Ghafoor, Usman; Gillani, Fouzia; Shah, Umer Hameed
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Control Adaptativo Basado en DDPG con Modo de Deslizamiento y Observador de Estado Extendida para Sistemas de Robots Multicuerpo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Diseño de control robusto
Control por modo deslizante
Incertidumbres
Perturbaciones
Variaciones de parámetros
Dinámica del sistema
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
Esta investigación presenta un diseño de control robusto para sistemas robóticos multibody, incorporando control por modo deslizante (SMC) para la robustez contra incertidumbres y perturbaciones. SMC logra esto dirigiendo los estados del sistema hacia una superficie deslizante predefinida para la estabilidad en tiempo finito. Sin embargo, el desafío surge al seleccionar los parámetros del controlador, específicamente la ganancia de conmutación, ya que depende de los límites superiores de las perturbaciones, incluidas las no linealidades, incertidumbres y perturbaciones que afectan al sistema. En consecuencia, la selección de ganancia se vuelve desafiante cuando la dinámica del sistema es desconocida. Para abordar este problema, se integra un observador de estado extendido (ESO) con SMC, resultando en SMCESO, que trata la dinámica del sistema y las perturbaciones como perturbaciones y las estima para compensar sus efectos en la respuesta del sistema, asegurando un rendimiento robusto. Para mejorar aún más el rendimiento del sistema, se emplea un gradiente de política determinista profundo (DDPG) para ajustar SMCESO, utilizando tanto estados reales como estimados como estados de entrada para el agente DDPG y la selección de recompensas. Este proceso de entrenamiento mejora tanto el rendimiento de seguimiento como el de estimación. Además, el método propuesto se compara con el PID óptimo, SMC, y en presencia de perturbaciones externas y variación de parámetros. Las simulaciones de MATLAB/Simulink confirman que, en general, el SMCESO proporciona un rendimiento robusto, especialmente con variaciones de parámetros, donde otros controladores luchan por hacer converger el error de seguimiento a cero.
Descripción
Esta investigación presenta un diseño de control robusto para sistemas robóticos multibody, incorporando control por modo deslizante (SMC) para la robustez contra incertidumbres y perturbaciones. SMC logra esto dirigiendo los estados del sistema hacia una superficie deslizante predefinida para la estabilidad en tiempo finito. Sin embargo, el desafío surge al seleccionar los parámetros del controlador, específicamente la ganancia de conmutación, ya que depende de los límites superiores de las perturbaciones, incluidas las no linealidades, incertidumbres y perturbaciones que afectan al sistema. En consecuencia, la selección de ganancia se vuelve desafiante cuando la dinámica del sistema es desconocida. Para abordar este problema, se integra un observador de estado extendido (ESO) con SMC, resultando en SMCESO, que trata la dinámica del sistema y las perturbaciones como perturbaciones y las estima para compensar sus efectos en la respuesta del sistema, asegurando un rendimiento robusto. Para mejorar aún más el rendimiento del sistema, se emplea un gradiente de política determinista profundo (DDPG) para ajustar SMCESO, utilizando tanto estados reales como estimados como estados de entrada para el agente DDPG y la selección de recompensas. Este proceso de entrenamiento mejora tanto el rendimiento de seguimiento como el de estimación. Además, el método propuesto se compara con el PID óptimo, SMC, y en presencia de perturbaciones externas y variación de parámetros. Las simulaciones de MATLAB/Simulink confirman que, en general, el SMCESO proporciona un rendimiento robusto, especialmente con variaciones de parámetros, donde otros controladores luchan por hacer converger el error de seguimiento a cero.