Un enfoque de aprendizaje profundo por refuerzo para la generación de morfologías óptimas en robots de baldosas reconfigurables

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Un enfoque de aprendizaje profundo por refuerzo para la generación de morfologías óptimas en robots de baldosas reconfigurables

Autores: Kalimuthu, Manivannan; Hayat, Abdullah Aamir; Pathmakumar, Thejus; Rajesh Elara, Mohan; Wood, Kristin Lee

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico

2023

Un enfoque de aprendizaje profundo por refuerzo para la generación de morfologías óptimas en robots de baldosas reconfigurables

Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Robots reconfigurables

Morfología

Aprendizaje por refuerzo

Espacio de diseño

Morfologías óptimas

Entorno

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 37

Citaciones: Sin citaciones

Los robots reconfigurables tienen el potencial de realizar tareas complejas adaptando su morfología a diferentes entornos. Sin embargo, diseñar morfologías óptimas para estos robots es un desafío debido al amplio espacio de diseño y las complejas interacciones entre el robot y el entorno. Un robot interno llamado , que tiene cuatro unidades móviles holonómicas conectadas con tres articulaciones de bisagra, está diseñado para maximizar la cobertura de área con sus características de cambio de forma utilizando los principios de diseño de transformación (TDP). Se utiliza el enfoque de aprendizaje por refuerzo (RL) para identificar las morfologías óptimas de una vasta combinación de ángulos de bisagra para una tarea específica al maximizar una señal de recompensa que refleja el rendimiento del robot. El enfoque propuesto implica tres pasos: (i) Modelar el espacio de diseño de Smorphi con un proceso de decisión de Markov (MDP) para la toma de decisiones secuenciales; (ii) un planificador de ruta de cobertura completa basado en huellas para calcular métricas de cobertura y longitud de ruta para varias morfologías de Smorphi; y (iii) optimizar políticas a través de la optimización de políticas proximales (PPO) y las técnicas de aprendizaje por refuerzo del actor crítico de ventaja asincrónica (A3C), lo que resulta en la generación de configuraciones de robots Smorphi energéticamente eficientes y óptimas al maximizar recompensas. El enfoque propuesto se aplica y valida utilizando dos mapas de entorno diferentes, y los resultados también se comparan con las formas aleatorias subóptimas junto con las soluciones de la frontera de Pareto utilizando NSGA-II. El estudio contribuye al campo de los robots reconfigurables al proporcionar un enfoque sistemático para generar morfologías óptimas que pueden mejorar el rendimiento de los robots reconfigurables en una variedad de tareas.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro