Combinando conocimientos previos y aprendizaje por refuerzo para caminar de un robot bípedo de piernas telescópicas en paralelo

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Combinando conocimientos previos y aprendizaje por refuerzo para caminar de un robot bípedo de piernas telescópicas en paralelo

Autores: Xue, Jie; Huangfu, Jiaqi; Hou, Yunfeng; Mou, Haiming

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico

2025

Combinando conocimientos previos y aprendizaje por refuerzo para caminar de un robot bípedo de piernas telescópicas en paralelo

Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Pierna telescópica

Robot bípedo

Alineación paralela

Aprendizaje por imitación

Aprendizaje por refuerzo

Reasignación de movimiento

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 19

Citaciones: Sin citaciones

El robot bípedo de pierna telescópica de deslizamiento dual paralelo (L04) se caracteriza por su estructura simple y baja inercia rotacional de la pierna, lo que contribuye a su eficiencia al caminar. Sin embargo, los métodos de extremo a extremo a menudo pasan por alto la estructura física del robot, lo que dificulta mantener la alineación paralela de los deslizadores duales, lo que a su vez compromete la estabilidad al caminar. Una solución potencial a este problema implica utilizar el aprendizaje por imitación para replicar datos de movimiento humano. Sin embargo, la estructura de pierna telescópica dual del robot L04 dificulta la retargetización de datos de movimiento humano. Para habilitar el caminar de L04, diseñamos un método que integra conocimiento previo con aprendizaje por refuerzo (PFRL), específicamente diseñado para la estructura de deslizamiento dual paralelo. Utilizamos el conocimiento previo como una acción de avance para compensar las no linealidades del sistema; mientras tanto, la acción de retroalimentación generada por la red de políticas regula de forma adaptativa el equilibrio dinámico y, combinada con la acción de avance, controla conjuntamente el caminar del robot. PFRL impone restricciones dentro del espacio de movimiento para mitigar el comportamiento caótico de los deslizadores duales paralelos. Los resultados experimentales muestran que nuestro método logra con éxito la transferencia de sim2real en un robot bípedo real sin necesidad de técnicas de aleatorización de dominio o funciones de recompensa intrincadas. L04 logra caminar de forma omnidireccional con un consumo mínimo de energía y muestra robustez contra perturbaciones externas.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro