Control de Vibración y Posición de un Manipulador Flexible de Dos Enlaces Usando Aprendizaje por Refuerzo
Autores: Sasaki, Minoru; Muguro, Joseph; Kitano, Fumiya; Njeri, Waweru; Maeno, Daiki; Matsushita, Kojiro
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Control de Vibración y Posición de un Manipulador Flexible de Dos Enlaces Usando Aprendizaje por Refuerzo
Categoría
Tecnología de Equipos y Accesorios
Subcategoría
Diseño de equipos y herramientas
Palabras clave
Industrias
De alta velocidad
Energéticamente eficientes
Rentables
Robots manipuladores de enlace flexible
Aprendizaje por refuerzo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
En los últimos años, las industrias han enfatizado cada vez más la necesidad de soluciones de alta velocidad, eficientes en energía y rentables. Como resultado, ha habido un creciente interés en desarrollar robots manipuladores de enlace flexible para satisfacer estos requisitos. Sin embargo, reducir el peso del manipulador conduce a una mayor flexibilidad que, a su vez, causa vibraciones. Este artículo de investigación presenta un enfoque novedoso para controlar la vibración y el movimiento de un manipulador flexible de dos enlaces utilizando aprendizaje por refuerzo. El sistema propuesto utiliza optimización de políticas de región de confianza para entrenar el efector final del manipulador para alcanzar una posición objetivo deseada, mientras minimiza la vibración y la tensión en la raíz del enlace. Para lograr los objetivos de la investigación, se diseña un modelo 3D del manipulador de enlace flexible y se identifica una función de recompensa óptima para guiar el proceso de aprendizaje. Los resultados demuestran que el enfoque propuesto suprime con éxito la vibración y la tensión al mover el efector final a la posición objetivo. Además, el modelo entrenado se aplica a un manipulador flexible físico para la verificación del control en el mundo real. Sin embargo, se observa que el rendimiento del modelo entrenado no cumple con las expectativas, debido a los desafíos de la simulación a la realidad. Estos desafíos pueden incluir diferencias no anticipadas en la dinámica, problemas de calibración, limitaciones de los actuadores u otros factores que afectan el rendimiento y el comportamiento del sistema en el mundo real. Por lo tanto, se recomiendan investigaciones y mejoras adicionales para cerrar esta brecha y mejorar la aplicabilidad del enfoque propuesto.
Descripción
En los últimos años, las industrias han enfatizado cada vez más la necesidad de soluciones de alta velocidad, eficientes en energía y rentables. Como resultado, ha habido un creciente interés en desarrollar robots manipuladores de enlace flexible para satisfacer estos requisitos. Sin embargo, reducir el peso del manipulador conduce a una mayor flexibilidad que, a su vez, causa vibraciones. Este artículo de investigación presenta un enfoque novedoso para controlar la vibración y el movimiento de un manipulador flexible de dos enlaces utilizando aprendizaje por refuerzo. El sistema propuesto utiliza optimización de políticas de región de confianza para entrenar el efector final del manipulador para alcanzar una posición objetivo deseada, mientras minimiza la vibración y la tensión en la raíz del enlace. Para lograr los objetivos de la investigación, se diseña un modelo 3D del manipulador de enlace flexible y se identifica una función de recompensa óptima para guiar el proceso de aprendizaje. Los resultados demuestran que el enfoque propuesto suprime con éxito la vibración y la tensión al mover el efector final a la posición objetivo. Además, el modelo entrenado se aplica a un manipulador flexible físico para la verificación del control en el mundo real. Sin embargo, se observa que el rendimiento del modelo entrenado no cumple con las expectativas, debido a los desafíos de la simulación a la realidad. Estos desafíos pueden incluir diferencias no anticipadas en la dinámica, problemas de calibración, limitaciones de los actuadores u otros factores que afectan el rendimiento y el comportamiento del sistema en el mundo real. Por lo tanto, se recomiendan investigaciones y mejoras adicionales para cerrar esta brecha y mejorar la aplicabilidad del enfoque propuesto.