Un enfoque de aprendizaje por refuerzo profundo para la solución de cinemática inversa de un manipulador robótico de alto grado de libertad

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Un enfoque de aprendizaje por refuerzo profundo para la solución de cinemática inversa de un manipulador robótico de alto grado de libertad

Autores: Malik, Aryslan; Lischuk, Yevgeniy; Henderson, Troy; Prazenica, Richard

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico

2022

Un enfoque de aprendizaje por refuerzo profundo para la solución de cinemática inversa de un manipulador robótico de alto grado de libertad

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Control de manipuladores robóticos

Cinemática Inversa

Aprendizaje por Refuerzo Profundo

7 Grados de Libertad

Producto de Exponenciales

Red Q Profunda

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 29

Citaciones: Sin citaciones

La base y el énfasis del control de manipuladores robóticos es la Cinemática Inversa (IK). Debido a la complejidad de la derivación, la dificultad de cálculo y la redundancia, las soluciones tradicionales de IK presentan numerosos desafíos para el funcionamiento de una variedad de manipuladores robóticos. Este documento desarrolla un enfoque de Aprendizaje por Refuerzo Profundo (RL) para resolver el problema de IK de un manipulador robótico de 7 Grados de Libertad (DOF) utilizando el Producto de Exponenciales (PoE) como herramienta de cálculo de Cinemática Directa (FK) y la Red Q Profunda (DQN) como solucionador de IK. El enfoque seleccionado es arquitectónicamente más simple, lo que lo hace más rápido y fácil de implementar, así como más estable, porque es menos sensible a los hiperparámetros que los algoritmos de espacios de acción continua. El algoritmo está diseñado para producir trayectorias en el espacio de juntas a partir de una trayectoria dada del efector final. Se exploraron diferentes arquitecturas de red y la salida de la DQN se implementó experimentalmente en un brazo robótico Sawyer. La DQN fue capaz de encontrar diferentes trayectorias correspondientes a un camino cartesiano especificado del efector final. El agente de la red pudo aprender trayectorias aleatorias de Bézier y de línea recta del efector final en un marco de tiempo razonable con buena precisión, demostrando que, aunque la DQN se utiliza principalmente en espacios de solución discretos, podría aplicarse para generar trayectorias en el espacio de juntas.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro