Un enfoque de aprendizaje por refuerzo profundo para la solución de cinemática inversa de un manipulador robótico de alto grado de libertad
Autores: Malik, Aryslan; Lischuk, Yevgeniy; Henderson, Troy; Prazenica, Richard
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un enfoque de aprendizaje por refuerzo profundo para la solución de cinemática inversa de un manipulador robótico de alto grado de libertad
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Control de manipuladores robóticos
Cinemática Inversa
Aprendizaje por Refuerzo Profundo
7 Grados de Libertad
Producto de Exponenciales
Red Q Profunda
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
La base y el énfasis del control de manipuladores robóticos es la Cinemática Inversa (IK). Debido a la complejidad de la derivación, la dificultad de cálculo y la redundancia, las soluciones tradicionales de IK presentan numerosos desafíos para el funcionamiento de una variedad de manipuladores robóticos. Este documento desarrolla un enfoque de Aprendizaje por Refuerzo Profundo (RL) para resolver el problema de IK de un manipulador robótico de 7 Grados de Libertad (DOF) utilizando el Producto de Exponenciales (PoE) como herramienta de cálculo de Cinemática Directa (FK) y la Red Q Profunda (DQN) como solucionador de IK. El enfoque seleccionado es arquitectónicamente más simple, lo que lo hace más rápido y fácil de implementar, así como más estable, porque es menos sensible a los hiperparámetros que los algoritmos de espacios de acción continua. El algoritmo está diseñado para producir trayectorias en el espacio de juntas a partir de una trayectoria dada del efector final. Se exploraron diferentes arquitecturas de red y la salida de la DQN se implementó experimentalmente en un brazo robótico Sawyer. La DQN fue capaz de encontrar diferentes trayectorias correspondientes a un camino cartesiano especificado del efector final. El agente de la red pudo aprender trayectorias aleatorias de Bézier y de línea recta del efector final en un marco de tiempo razonable con buena precisión, demostrando que, aunque la DQN se utiliza principalmente en espacios de solución discretos, podría aplicarse para generar trayectorias en el espacio de juntas.
Descripción
La base y el énfasis del control de manipuladores robóticos es la Cinemática Inversa (IK). Debido a la complejidad de la derivación, la dificultad de cálculo y la redundancia, las soluciones tradicionales de IK presentan numerosos desafíos para el funcionamiento de una variedad de manipuladores robóticos. Este documento desarrolla un enfoque de Aprendizaje por Refuerzo Profundo (RL) para resolver el problema de IK de un manipulador robótico de 7 Grados de Libertad (DOF) utilizando el Producto de Exponenciales (PoE) como herramienta de cálculo de Cinemática Directa (FK) y la Red Q Profunda (DQN) como solucionador de IK. El enfoque seleccionado es arquitectónicamente más simple, lo que lo hace más rápido y fácil de implementar, así como más estable, porque es menos sensible a los hiperparámetros que los algoritmos de espacios de acción continua. El algoritmo está diseñado para producir trayectorias en el espacio de juntas a partir de una trayectoria dada del efector final. Se exploraron diferentes arquitecturas de red y la salida de la DQN se implementó experimentalmente en un brazo robótico Sawyer. La DQN fue capaz de encontrar diferentes trayectorias correspondientes a un camino cartesiano especificado del efector final. El agente de la red pudo aprender trayectorias aleatorias de Bézier y de línea recta del efector final en un marco de tiempo razonable con buena precisión, demostrando que, aunque la DQN se utiliza principalmente en espacios de solución discretos, podría aplicarse para generar trayectorias en el espacio de juntas.