logo móvil
Contáctanos

Un enfoque de aprendizaje por refuerzo profundo para la solución de cinemática inversa de un manipulador robótico de alto grado de libertad

Autores: Malik, Aryslan; Lischuk, Yevgeniy; Henderson, Troy; Prazenica, Richard

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Un enfoque de aprendizaje por refuerzo profundo para la solución de cinemática inversa de un manipulador robótico de alto grado de libertad


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Control de manipuladores robóticos
Cinemática Inversa
Aprendizaje por Refuerzo Profundo
7 Grados de Libertad
Producto de Exponenciales
Red Q Profunda

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 29

Citaciones: Sin citaciones


Descripción
La base y el énfasis del control de manipuladores robóticos es la Cinemática Inversa (IK). Debido a la complejidad de la derivación, la dificultad de cálculo y la redundancia, las soluciones tradicionales de IK presentan numerosos desafíos para el funcionamiento de una variedad de manipuladores robóticos. Este documento desarrolla un enfoque de Aprendizaje por Refuerzo Profundo (RL) para resolver el problema de IK de un manipulador robótico de 7 Grados de Libertad (DOF) utilizando el Producto de Exponenciales (PoE) como herramienta de cálculo de Cinemática Directa (FK) y la Red Q Profunda (DQN) como solucionador de IK. El enfoque seleccionado es arquitectónicamente más simple, lo que lo hace más rápido y fácil de implementar, así como más estable, porque es menos sensible a los hiperparámetros que los algoritmos de espacios de acción continua. El algoritmo está diseñado para producir trayectorias en el espacio de juntas a partir de una trayectoria dada del efector final. Se exploraron diferentes arquitecturas de red y la salida de la DQN se implementó experimentalmente en un brazo robótico Sawyer. La DQN fue capaz de encontrar diferentes trayectorias correspondientes a un camino cartesiano especificado del efector final. El agente de la red pudo aprender trayectorias aleatorias de Bézier y de línea recta del efector final en un marco de tiempo razonable con buena precisión, demostrando que, aunque la DQN se utiliza principalmente en espacios de solución discretos, podría aplicarse para generar trayectorias en el espacio de juntas.

Otros recursos que podrían interesarte

Temas Virtualpro