Un enfoque de aprendizaje profundo por refuerzo para la generación de morfologías óptimas en robots de baldosas reconfigurables
Autores: Kalimuthu, Manivannan; Hayat, Abdullah Aamir; Pathmakumar, Thejus; Rajesh Elara, Mohan; Wood, Kristin Lee
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un enfoque de aprendizaje profundo por refuerzo para la generación de morfologías óptimas en robots de baldosas reconfigurables
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Robots reconfigurables
Morfología
Aprendizaje por refuerzo
Espacio de diseño
Morfologías óptimas
Entorno
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
Los robots reconfigurables tienen el potencial de realizar tareas complejas adaptando su morfología a diferentes entornos. Sin embargo, diseñar morfologías óptimas para estos robots es un desafío debido al amplio espacio de diseño y las complejas interacciones entre el robot y el entorno. Un robot interno llamado , que tiene cuatro unidades móviles holonómicas conectadas con tres articulaciones de bisagra, está diseñado para maximizar la cobertura de área con sus características de cambio de forma utilizando los principios de diseño de transformación (TDP). Se utiliza el enfoque de aprendizaje por refuerzo (RL) para identificar las morfologías óptimas de una vasta combinación de ángulos de bisagra para una tarea específica al maximizar una señal de recompensa que refleja el rendimiento del robot. El enfoque propuesto implica tres pasos: (i) Modelar el espacio de diseño de Smorphi con un proceso de decisión de Markov (MDP) para la toma de decisiones secuenciales; (ii) un planificador de ruta de cobertura completa basado en huellas para calcular métricas de cobertura y longitud de ruta para varias morfologías de Smorphi; y (iii) optimizar políticas a través de la optimización de políticas proximales (PPO) y las técnicas de aprendizaje por refuerzo del actor crítico de ventaja asincrónica (A3C), lo que resulta en la generación de configuraciones de robots Smorphi energéticamente eficientes y óptimas al maximizar recompensas. El enfoque propuesto se aplica y valida utilizando dos mapas de entorno diferentes, y los resultados también se comparan con las formas aleatorias subóptimas junto con las soluciones de la frontera de Pareto utilizando NSGA-II. El estudio contribuye al campo de los robots reconfigurables al proporcionar un enfoque sistemático para generar morfologías óptimas que pueden mejorar el rendimiento de los robots reconfigurables en una variedad de tareas.
Descripción
Los robots reconfigurables tienen el potencial de realizar tareas complejas adaptando su morfología a diferentes entornos. Sin embargo, diseñar morfologías óptimas para estos robots es un desafío debido al amplio espacio de diseño y las complejas interacciones entre el robot y el entorno. Un robot interno llamado , que tiene cuatro unidades móviles holonómicas conectadas con tres articulaciones de bisagra, está diseñado para maximizar la cobertura de área con sus características de cambio de forma utilizando los principios de diseño de transformación (TDP). Se utiliza el enfoque de aprendizaje por refuerzo (RL) para identificar las morfologías óptimas de una vasta combinación de ángulos de bisagra para una tarea específica al maximizar una señal de recompensa que refleja el rendimiento del robot. El enfoque propuesto implica tres pasos: (i) Modelar el espacio de diseño de Smorphi con un proceso de decisión de Markov (MDP) para la toma de decisiones secuenciales; (ii) un planificador de ruta de cobertura completa basado en huellas para calcular métricas de cobertura y longitud de ruta para varias morfologías de Smorphi; y (iii) optimizar políticas a través de la optimización de políticas proximales (PPO) y las técnicas de aprendizaje por refuerzo del actor crítico de ventaja asincrónica (A3C), lo que resulta en la generación de configuraciones de robots Smorphi energéticamente eficientes y óptimas al maximizar recompensas. El enfoque propuesto se aplica y valida utilizando dos mapas de entorno diferentes, y los resultados también se comparan con las formas aleatorias subóptimas junto con las soluciones de la frontera de Pareto utilizando NSGA-II. El estudio contribuye al campo de los robots reconfigurables al proporcionar un enfoque sistemático para generar morfologías óptimas que pueden mejorar el rendimiento de los robots reconfigurables en una variedad de tareas.