logo móvil
Contáctanos

Un enfoque de aprendizaje profundo por refuerzo para la generación de morfologías óptimas en robots de baldosas reconfigurables

Autores: Kalimuthu, Manivannan; Hayat, Abdullah Aamir; Pathmakumar, Thejus; Rajesh Elara, Mohan; Wood, Kristin Lee

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Un enfoque de aprendizaje profundo por refuerzo para la generación de morfologías óptimas en robots de baldosas reconfigurables


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Robots reconfigurables
Morfología
Aprendizaje por refuerzo
Espacio de diseño
Morfologías óptimas
Entorno

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 37

Citaciones: Sin citaciones


Descripción
Los robots reconfigurables tienen el potencial de realizar tareas complejas adaptando su morfología a diferentes entornos. Sin embargo, diseñar morfologías óptimas para estos robots es un desafío debido al amplio espacio de diseño y las complejas interacciones entre el robot y el entorno. Un robot interno llamado , que tiene cuatro unidades móviles holonómicas conectadas con tres articulaciones de bisagra, está diseñado para maximizar la cobertura de área con sus características de cambio de forma utilizando los principios de diseño de transformación (TDP). Se utiliza el enfoque de aprendizaje por refuerzo (RL) para identificar las morfologías óptimas de una vasta combinación de ángulos de bisagra para una tarea específica al maximizar una señal de recompensa que refleja el rendimiento del robot. El enfoque propuesto implica tres pasos: (i) Modelar el espacio de diseño de Smorphi con un proceso de decisión de Markov (MDP) para la toma de decisiones secuenciales; (ii) un planificador de ruta de cobertura completa basado en huellas para calcular métricas de cobertura y longitud de ruta para varias morfologías de Smorphi; y (iii) optimizar políticas a través de la optimización de políticas proximales (PPO) y las técnicas de aprendizaje por refuerzo del actor crítico de ventaja asincrónica (A3C), lo que resulta en la generación de configuraciones de robots Smorphi energéticamente eficientes y óptimas al maximizar recompensas. El enfoque propuesto se aplica y valida utilizando dos mapas de entorno diferentes, y los resultados también se comparan con las formas aleatorias subóptimas junto con las soluciones de la frontera de Pareto utilizando NSGA-II. El estudio contribuye al campo de los robots reconfigurables al proporcionar un enfoque sistemático para generar morfologías óptimas que pueden mejorar el rendimiento de los robots reconfigurables en una variedad de tareas.

Otros recursos que podrían interesarte

Temas Virtualpro