Control de Trayectoria de un Robot Articulado Basado en Aprendizaje por Refuerzo Directo

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Control de Trayectoria de un Robot Articulado Basado en Aprendizaje por Refuerzo Directo

Autores: Tsai, Chia-Hao; Lin, Jun-Ji; Hsieh, Teng-Feng; Yen, Jia-Yush

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico

2022

Control de Trayectoria de un Robot Articulado Basado en Aprendizaje por Refuerzo Directo

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Aprendizaje por refuerzo

Control de par directo

Seguimiento de trayectorias

Robot articulado

Control predictivo de modelos

Cinemática inversa

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 27

Citaciones: Sin citaciones

El Aprendizaje por Refuerzo (RL) está ganando mucha atención en la investigación porque permite que el sistema aprenda al interactuar con el entorno. Sin embargo, a pesar de todas estas aplicaciones exitosas, la aplicación de RL en el control directo de torque de junta sin la ayuda de un modelo dinámico subyacente no se ha reportado en la literatura. Este estudio presenta una estructura de red dividida que permite el entrenamiento exitoso de RL para aprender el control directo de torque para seguir trayectorias de un robot articulado de seis ejes sin conocimiento previo del modelo dinámico del robot. El entrenamiento tomó mucho tiempo en converger. Sin embargo, pudimos demostrar el control exitoso de cuatro trayectorias diferentes sin necesidad de un modelo dinámico preciso y cálculos complejos de cinemática inversa. Para mostrar la efectividad del control basado en RL, también comparamos el control RL con el Control Predictivo de Modelo (MPC), otro método popular de control de trayectorias. Nuestros resultados muestran que, aunque el MPC logra un control más suave y preciso, no trata automáticamente la singularidad. Además, requiere cálculos complejos de dinámica inversa. Por otro lado, el controlador RL evitó instintivamente la acción violenta alrededor de las singularidades.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro