Acoplamiento de precisión de un cuadricóptero plegable en un robot con patas de rueda a través de CFNTSM con GFA-FEO y aprendizaje profundo por refuerzo FiLM-SAC
Autores: Gu, Qibin; Sun, Zhenxing
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Acoplamiento de precisión de un cuadricóptero plegable en un robot con patas de rueda a través de CFNTSM con GFA-FEO y aprendizaje profundo por refuerzo FiLM-SAC
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Vehículos aéreos no tripulados
Robots bípedos
Respuesta a desastres
Acoplamiento autónomo
Cuadricóptero
Superficie de aterrizaje
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Desplegar vehículos aéreos no tripulados (VANT) de manera cooperativa con robots bípedos para la respuesta a desastres y la inspección requiere acoplamiento autónomo en plataformas de caminata en miniatura. Este estudio aborda el problema de aterrizar un cuadricóptero plegable en la parte posterior de un robot de patas con ruedas que trota (300x180 mm) y posteriormente despegar mientras lo transporta como carga. Cuatro desafíos estrechamente relacionados distinguen esta tarea del aterrizaje convencional en plataformas móviles: (i) una superficie de aterrizaje extremadamente pequeña, (ii) vibraciones periódicas inducidas por la marcha a 2.5 Hz, (iii) traducción continua de la plataforma a 0.3-0.8 m/s, y (iv) acoplamiento en la superficie que requiere coincidencia simultánea de posición y actitud en lugar de un simple seguimiento de puntos. El marco propuesto comprende cuatro componentes: (1) un novedoso mecanismo de plegado de manivela-brazo de un solo servo que reduce la huella del cuerpo plegado en un 48.5% y la dimensión lineal máxima de 590 mm a 309 mm (47.6%) en comparación con el diseño anterior de doble servo; (2) un controlador de Modo de Deslizamiento Terminal No Singular Continuo Rápido (CFNTSM) en etapas combinado con un Observador Extendido de Tiempo Finito Consciente de la Frecuencia de Marcha (GFA-FEO); (3) una política de aprendizaje por refuerzo residual de Actor-Crítico de Modulación Lineal por Características (FiLM-SAC) condicionada a estados físicos y fase de misión, con un peso de confianza adaptativo (t); y (4) una estrategia de despegue adaptativa a la carga con conmutación rápida de parámetros para manejar el aumento de masa doble. Amplias simulaciones de Monte Carlo y estudios de ablación en tres grupos de experimentos demuestran que el marco jerárquico propuesto logra una precisión de posición subcentimétrica (<10 mm) y una coincidencia de actitud <3 grados en una plataforma de caminata. Cuantitativamente, el método completo reduce el RMSE de acoplamiento en un 42% en relación con el controlador CFNTSM + GFA-FEO basado en modelo sin RL residual (4.2 vs. 7.2 mm) y reduce el RMSE de despegue posterior al bloqueo en un 63% a través de la conmutación rápida de FEO (16.2 vs. 44.2 mm).
Descripción
Desplegar vehículos aéreos no tripulados (VANT) de manera cooperativa con robots bípedos para la respuesta a desastres y la inspección requiere acoplamiento autónomo en plataformas de caminata en miniatura. Este estudio aborda el problema de aterrizar un cuadricóptero plegable en la parte posterior de un robot de patas con ruedas que trota (300x180 mm) y posteriormente despegar mientras lo transporta como carga. Cuatro desafíos estrechamente relacionados distinguen esta tarea del aterrizaje convencional en plataformas móviles: (i) una superficie de aterrizaje extremadamente pequeña, (ii) vibraciones periódicas inducidas por la marcha a 2.5 Hz, (iii) traducción continua de la plataforma a 0.3-0.8 m/s, y (iv) acoplamiento en la superficie que requiere coincidencia simultánea de posición y actitud en lugar de un simple seguimiento de puntos. El marco propuesto comprende cuatro componentes: (1) un novedoso mecanismo de plegado de manivela-brazo de un solo servo que reduce la huella del cuerpo plegado en un 48.5% y la dimensión lineal máxima de 590 mm a 309 mm (47.6%) en comparación con el diseño anterior de doble servo; (2) un controlador de Modo de Deslizamiento Terminal No Singular Continuo Rápido (CFNTSM) en etapas combinado con un Observador Extendido de Tiempo Finito Consciente de la Frecuencia de Marcha (GFA-FEO); (3) una política de aprendizaje por refuerzo residual de Actor-Crítico de Modulación Lineal por Características (FiLM-SAC) condicionada a estados físicos y fase de misión, con un peso de confianza adaptativo (t); y (4) una estrategia de despegue adaptativa a la carga con conmutación rápida de parámetros para manejar el aumento de masa doble. Amplias simulaciones de Monte Carlo y estudios de ablación en tres grupos de experimentos demuestran que el marco jerárquico propuesto logra una precisión de posición subcentimétrica (<10 mm) y una coincidencia de actitud <3 grados en una plataforma de caminata. Cuantitativamente, el método completo reduce el RMSE de acoplamiento en un 42% en relación con el controlador CFNTSM + GFA-FEO basado en modelo sin RL residual (4.2 vs. 7.2 mm) y reduce el RMSE de despegue posterior al bloqueo en un 63% a través de la conmutación rápida de FEO (16.2 vs. 44.2 mm).