Habilidades de transferencia de habilidades de manipulación de robots de Sim a Real en entornos no estructurados
Autores: Yin, Zikang; Ye, Chao; An, Hao; Lin, Weiyang; Wang, Zhifeng
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Habilidades de transferencia de habilidades de manipulación de robots de Sim a Real en entornos no estructurados
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Control de fuerza de robot
Entornos no estructurados
Cumplimiento
Interacción segura humano-robot
Aprendizaje por refuerzo
Habilidades motoras
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 48
Citaciones: Sin citaciones
El control de fuerza del robot que necesita ser personalizado para la estructura del robot en entornos no estructurados con parámetros difíciles de ajustar garantiza la conformidad de los robots y la interacción segura humano-robot en un entorno laboral cada vez más expansivo. Aunque el aprendizaje por refuerzo proporciona una nueva idea para el ajuste adaptativo de estos parámetros, la política a menudo necesita ser entrenada desde cero cuando se utiliza en nuevas robóticas, incluso en la misma tarea. Este documento propone el algoritmo Natural Actor-Critic episódico con límites de acción para mejorar el control de admisión del robot y transferir habilidades motoras entre robots. Las habilidades de movimiento aprendidas por robots simulados simples pueden aplicarse a robots reales complejos, reduciendo la dificultad de entrenamiento y el consumo de tiempo. El control de admisión asegura la realizabilidad y movilidad de la conformidad del robot en todas las direcciones. Al mismo tiempo, el algoritmo de aprendizaje por refuerzo construye el modelo del entorno y realiza el ajuste adaptativo de los parámetros de impedancia durante el movimiento del robot. En tareas típicas de contacto de robots, las habilidades motoras se entrenan en un robot con una estructura simple en simulación y se utilizan para un robot con una estructura compleja en la realidad para realizar la misma tarea. El rendimiento del robot real en cada tarea es similar al del robot simulado en el mismo entorno, lo que verifica la efectividad del método.
Descripción
El control de fuerza del robot que necesita ser personalizado para la estructura del robot en entornos no estructurados con parámetros difíciles de ajustar garantiza la conformidad de los robots y la interacción segura humano-robot en un entorno laboral cada vez más expansivo. Aunque el aprendizaje por refuerzo proporciona una nueva idea para el ajuste adaptativo de estos parámetros, la política a menudo necesita ser entrenada desde cero cuando se utiliza en nuevas robóticas, incluso en la misma tarea. Este documento propone el algoritmo Natural Actor-Critic episódico con límites de acción para mejorar el control de admisión del robot y transferir habilidades motoras entre robots. Las habilidades de movimiento aprendidas por robots simulados simples pueden aplicarse a robots reales complejos, reduciendo la dificultad de entrenamiento y el consumo de tiempo. El control de admisión asegura la realizabilidad y movilidad de la conformidad del robot en todas las direcciones. Al mismo tiempo, el algoritmo de aprendizaje por refuerzo construye el modelo del entorno y realiza el ajuste adaptativo de los parámetros de impedancia durante el movimiento del robot. En tareas típicas de contacto de robots, las habilidades motoras se entrenan en un robot con una estructura simple en simulación y se utilizan para un robot con una estructura compleja en la realidad para realizar la misma tarea. El rendimiento del robot real en cada tarea es similar al del robot simulado en el mismo entorno, lo que verifica la efectividad del método.