Navegación basada en una estrategia de entrenamiento y ejecución híbrida descentralizada y centralizada para el aprendizaje por refuerzo de múltiples robots móviles
Autores: Dai, Yanyan; Kim, Deokgyu; Lee, Kidong
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Navegación basada en una estrategia de entrenamiento y ejecución híbrida descentralizada y centralizada para el aprendizaje por refuerzo de múltiples robots móviles
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Desafíos
Planificación de rutas
Sistemas multirobot
Estrategia DCTE
Detección de colisiones
Eficiencia computacional
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
Al abordar los desafíos complejos de la planificación de rutas en sistemas de múltiples robots, este documento propone una novedosa Estrategia de Entrenamiento y Ejecución Híbrida Descentralizada y Centralizada (DCTE), con el objetivo de optimizar la eficiencia computacional y el rendimiento del sistema. La estrategia resuelve los problemas prevalentes de colisión y coordinación a través de un proceso de optimización escalonado. La estrategia DCTE comienza con un paso inicial de planificación de rutas descentralizado basado en Deep Q-Network (DQN), donde cada robot formula independientemente su ruta. Esto es seguido por una detección centralizada de colisiones cuyo análisis sirve para identificar posibles intersecciones o riesgos de colisión. Las rutas confirmadas como no intersectantes se utilizan para la ejecución, mientras que aquellas en áreas de colisión provocan un paso de replanificación dinámica utilizando DQN. Los robots se tratan mutuamente como obstáculos dinámicos a sortear, asegurando una operación continua sin interrupciones. El paso final implica vincular las rutas recién optimizadas con las rutas seguras originales para formar una ruta de ejecución completa y segura. Este documento demuestra cómo esta estrategia estructurada no solo mitiga los riesgos de colisión, sino que también mejora significativamente la eficiencia computacional de los sistemas de múltiples robots. El tiempo de aprendizaje por refuerzo fue significativamente más corto, con la estrategia DCTE requiriendo solo 3 min y 36 s en comparación con 5 min y 33 s en los resultados de comparación de la sección de simulación. La mejora destaca las ventajas del método propuesto en mejorar la efectividad y eficiencia de los sistemas de múltiples robots.
Descripción
Al abordar los desafíos complejos de la planificación de rutas en sistemas de múltiples robots, este documento propone una novedosa Estrategia de Entrenamiento y Ejecución Híbrida Descentralizada y Centralizada (DCTE), con el objetivo de optimizar la eficiencia computacional y el rendimiento del sistema. La estrategia resuelve los problemas prevalentes de colisión y coordinación a través de un proceso de optimización escalonado. La estrategia DCTE comienza con un paso inicial de planificación de rutas descentralizado basado en Deep Q-Network (DQN), donde cada robot formula independientemente su ruta. Esto es seguido por una detección centralizada de colisiones cuyo análisis sirve para identificar posibles intersecciones o riesgos de colisión. Las rutas confirmadas como no intersectantes se utilizan para la ejecución, mientras que aquellas en áreas de colisión provocan un paso de replanificación dinámica utilizando DQN. Los robots se tratan mutuamente como obstáculos dinámicos a sortear, asegurando una operación continua sin interrupciones. El paso final implica vincular las rutas recién optimizadas con las rutas seguras originales para formar una ruta de ejecución completa y segura. Este documento demuestra cómo esta estrategia estructurada no solo mitiga los riesgos de colisión, sino que también mejora significativamente la eficiencia computacional de los sistemas de múltiples robots. El tiempo de aprendizaje por refuerzo fue significativamente más corto, con la estrategia DCTE requiriendo solo 3 min y 36 s en comparación con 5 min y 33 s en los resultados de comparación de la sección de simulación. La mejora destaca las ventajas del método propuesto en mejorar la efectividad y eficiencia de los sistemas de múltiples robots.