Combinando conocimientos previos y aprendizaje por refuerzo para caminar de un robot bípedo de piernas telescópicas en paralelo
Autores: Xue, Jie; Huangfu, Jiaqi; Hou, Yunfeng; Mou, Haiming
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Combinando conocimientos previos y aprendizaje por refuerzo para caminar de un robot bípedo de piernas telescópicas en paralelo
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Pierna telescópica
Robot bípedo
Alineación paralela
Aprendizaje por imitación
Aprendizaje por refuerzo
Reasignación de movimiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
El robot bípedo de pierna telescópica de deslizamiento dual paralelo (L04) se caracteriza por su estructura simple y baja inercia rotacional de la pierna, lo que contribuye a su eficiencia al caminar. Sin embargo, los métodos de extremo a extremo a menudo pasan por alto la estructura física del robot, lo que dificulta mantener la alineación paralela de los deslizadores duales, lo que a su vez compromete la estabilidad al caminar. Una solución potencial a este problema implica utilizar el aprendizaje por imitación para replicar datos de movimiento humano. Sin embargo, la estructura de pierna telescópica dual del robot L04 dificulta la retargetización de datos de movimiento humano. Para habilitar el caminar de L04, diseñamos un método que integra conocimiento previo con aprendizaje por refuerzo (PFRL), específicamente diseñado para la estructura de deslizamiento dual paralelo. Utilizamos el conocimiento previo como una acción de avance para compensar las no linealidades del sistema; mientras tanto, la acción de retroalimentación generada por la red de políticas regula de forma adaptativa el equilibrio dinámico y, combinada con la acción de avance, controla conjuntamente el caminar del robot. PFRL impone restricciones dentro del espacio de movimiento para mitigar el comportamiento caótico de los deslizadores duales paralelos. Los resultados experimentales muestran que nuestro método logra con éxito la transferencia de sim2real en un robot bípedo real sin necesidad de técnicas de aleatorización de dominio o funciones de recompensa intrincadas. L04 logra caminar de forma omnidireccional con un consumo mínimo de energía y muestra robustez contra perturbaciones externas.
Descripción
El robot bípedo de pierna telescópica de deslizamiento dual paralelo (L04) se caracteriza por su estructura simple y baja inercia rotacional de la pierna, lo que contribuye a su eficiencia al caminar. Sin embargo, los métodos de extremo a extremo a menudo pasan por alto la estructura física del robot, lo que dificulta mantener la alineación paralela de los deslizadores duales, lo que a su vez compromete la estabilidad al caminar. Una solución potencial a este problema implica utilizar el aprendizaje por imitación para replicar datos de movimiento humano. Sin embargo, la estructura de pierna telescópica dual del robot L04 dificulta la retargetización de datos de movimiento humano. Para habilitar el caminar de L04, diseñamos un método que integra conocimiento previo con aprendizaje por refuerzo (PFRL), específicamente diseñado para la estructura de deslizamiento dual paralelo. Utilizamos el conocimiento previo como una acción de avance para compensar las no linealidades del sistema; mientras tanto, la acción de retroalimentación generada por la red de políticas regula de forma adaptativa el equilibrio dinámico y, combinada con la acción de avance, controla conjuntamente el caminar del robot. PFRL impone restricciones dentro del espacio de movimiento para mitigar el comportamiento caótico de los deslizadores duales paralelos. Los resultados experimentales muestran que nuestro método logra con éxito la transferencia de sim2real en un robot bípedo real sin necesidad de técnicas de aleatorización de dominio o funciones de recompensa intrincadas. L04 logra caminar de forma omnidireccional con un consumo mínimo de energía y muestra robustez contra perturbaciones externas.