Desarrollo de un nuevo algoritmo de caminata estable y robusto para un robot humanoide utilizando aprendizaje por refuerzo profundo con fusión de datos de múltiples sensores

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Desarrollo de un nuevo algoritmo de caminata estable y robusto para un robot humanoide utilizando aprendizaje por refuerzo profundo con fusión de datos de múltiples sensores

Autores: Kaymak, Çar; Uçar, Ayegül; Güzeli, Cüneyt

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico

2023

Desarrollo de un nuevo algoritmo de caminata estable y robusto para un robot humanoide utilizando aprendizaje por refuerzo profundo con fusión de datos de múltiples sensores

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Movilidad confiable

Robots humanoides

Estrategias de caminar

Técnicas de aprendizaje por refuerzo

Parámetros de trayectoria

Sistema de equilibrio postural

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 25

Citaciones: Sin citaciones

La tarea difícil de crear movilidad confiable para robots humanoides ha sido estudiada durante décadas. Aunque se han propuesto varias estrategias de caminata diferentes y el rendimiento de la caminata ha aumentado sustancialmente, la estabilidad aún necesita alcanzar las expectativas. Las aplicaciones de las técnicas de Aprendizaje por Refuerzo (RL) están limitadas por la baja convergencia y el entrenamiento ineficaz. Este documento desarrolla un nuevo marco robusto y eficiente basado en el robot humanoide Robotis-OP2 combinado con un controlador típico generador de trayectorias y Aprendizaje Profundo por Refuerzo (DRL) para superar estas limitaciones. Este marco consiste en optimizar los parámetros de la trayectoria de caminata y el sistema de equilibrio postural. Se utilizan múltiples sensores del robot para la optimización de parámetros. Los parámetros de caminata se optimizan utilizando la Red Q Doble Doble Duelo (D3QN), uno de los algoritmos de DRL, en el simulador Webots. Se adopta la estrategia de cadera para el sistema de equilibrio postural. Se realizan estudios experimentales tanto en simulación como en entornos reales con el marco propuesto y el algoritmo de caminata de Robotis-OP2. Los resultados experimentales muestran que el robot realiza una caminata más estable con el marco propuesto que con el algoritmo de caminata de Robotis-OP2. Se cree que el marco propuesto será beneficioso para los investigadores que estudian en el campo de la locomoción de robots humanoides.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro