Navegación basada en una estrategia de entrenamiento y ejecución híbrida descentralizada y centralizada para el aprendizaje por refuerzo de múltiples robots móviles

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Navegación basada en una estrategia de entrenamiento y ejecución híbrida descentralizada y centralizada para el aprendizaje por refuerzo de múltiples robots móviles

Autores: Dai, Yanyan; Kim, Deokgyu; Lee, Kidong

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Navegación basada en una estrategia de entrenamiento y ejecución híbrida descentralizada y centralizada para el aprendizaje por refuerzo de múltiples robots móviles

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Desafíos

Planificación de rutas

Sistemas multirobot

Estrategia DCTE

Detección de colisiones

Eficiencia computacional

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 35

Citaciones: Sin citaciones

Al abordar los desafíos complejos de la planificación de rutas en sistemas de múltiples robots, este documento propone una novedosa Estrategia de Entrenamiento y Ejecución Híbrida Descentralizada y Centralizada (DCTE), con el objetivo de optimizar la eficiencia computacional y el rendimiento del sistema. La estrategia resuelve los problemas prevalentes de colisión y coordinación a través de un proceso de optimización escalonado. La estrategia DCTE comienza con un paso inicial de planificación de rutas descentralizado basado en Deep Q-Network (DQN), donde cada robot formula independientemente su ruta. Esto es seguido por una detección centralizada de colisiones cuyo análisis sirve para identificar posibles intersecciones o riesgos de colisión. Las rutas confirmadas como no intersectantes se utilizan para la ejecución, mientras que aquellas en áreas de colisión provocan un paso de replanificación dinámica utilizando DQN. Los robots se tratan mutuamente como obstáculos dinámicos a sortear, asegurando una operación continua sin interrupciones. El paso final implica vincular las rutas recién optimizadas con las rutas seguras originales para formar una ruta de ejecución completa y segura. Este documento demuestra cómo esta estrategia estructurada no solo mitiga los riesgos de colisión, sino que también mejora significativamente la eficiencia computacional de los sistemas de múltiples robots. El tiempo de aprendizaje por refuerzo fue significativamente más corto, con la estrategia DCTE requiriendo solo 3 min y 36 s en comparación con 5 min y 33 s en los resultados de comparación de la sección de simulación. La mejora destaca las ventajas del método propuesto en mejorar la efectividad y eficiencia de los sistemas de múltiples robots.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro