Navegación Cooperativa de Enjambres Usando Entrenamiento Centralizado y Ejecución Descentralizada
Autores: Azzam, Rana; Boiko, Igor; Zweiri, Yahya
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Navegación Cooperativa de Enjambres Usando Entrenamiento Centralizado y Ejecución Descentralizada
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Operaciones de enjambres de UAV autónomos
Aprendizaje por refuerzo multiagente
Tareas colaborativas
Escalable
En tiempo real
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La demanda de operaciones de enjambres de UAV autónomos ha ido en aumento tras el éxito de los UAV en diversas tareas desafiantes. Sin embargo, los enfoques convencionales de control de enjambres son inadecuados para hacer frente a la escalabilidad del enjambre, los requisitos computacionales y el rendimiento en tiempo real. En este artículo, demostramos la capacidad de los enfoques emergentes de aprendizaje por refuerzo multiagente (MARL) para tomar decisiones secuenciales de manera exitosa y eficiente durante tareas colaborativas de enjambres de UAV. Proponemos un enfoque MARL escalable y en tiempo real para la navegación colaborativa de UAV, donde los miembros del enjambre deben llegar a ubicaciones objetivo al mismo tiempo. Se utilizan entrenamiento centralizado y ejecución descentralizada (CTDE) para lograr esto, donde se emplea una combinación de refuerzo negativo y positivo en la función de recompensa. Se utiliza el aprendizaje por currículos para facilitar el rendimiento buscado, especialmente debido a la alta complejidad del problema que requiere una exploración extensa. Se utiliza un modelo de UAV que se asemeja mucho a la plataforma física respectiva para entrenar el marco propuesto y hacer que el entrenamiento y las pruebas sean realistas. La escalabilidad de la plataforma a varios tamaños de enjambre, velocidades, posiciones objetivo, dimensiones del entorno y masas de UAV se ha demostrado en (1) un escenario de entrega de carga y (2) formación de enjambres de UAV sin requerir ningún reentrenamiento o ajuste fino de los agentes. Los resultados de simulación obtenidos han demostrado la efectividad y generalizabilidad de nuestro marco MARL propuesto para la navegación cooperativa de UAV.
Descripción
La demanda de operaciones de enjambres de UAV autónomos ha ido en aumento tras el éxito de los UAV en diversas tareas desafiantes. Sin embargo, los enfoques convencionales de control de enjambres son inadecuados para hacer frente a la escalabilidad del enjambre, los requisitos computacionales y el rendimiento en tiempo real. En este artículo, demostramos la capacidad de los enfoques emergentes de aprendizaje por refuerzo multiagente (MARL) para tomar decisiones secuenciales de manera exitosa y eficiente durante tareas colaborativas de enjambres de UAV. Proponemos un enfoque MARL escalable y en tiempo real para la navegación colaborativa de UAV, donde los miembros del enjambre deben llegar a ubicaciones objetivo al mismo tiempo. Se utilizan entrenamiento centralizado y ejecución descentralizada (CTDE) para lograr esto, donde se emplea una combinación de refuerzo negativo y positivo en la función de recompensa. Se utiliza el aprendizaje por currículos para facilitar el rendimiento buscado, especialmente debido a la alta complejidad del problema que requiere una exploración extensa. Se utiliza un modelo de UAV que se asemeja mucho a la plataforma física respectiva para entrenar el marco propuesto y hacer que el entrenamiento y las pruebas sean realistas. La escalabilidad de la plataforma a varios tamaños de enjambre, velocidades, posiciones objetivo, dimensiones del entorno y masas de UAV se ha demostrado en (1) un escenario de entrega de carga y (2) formación de enjambres de UAV sin requerir ningún reentrenamiento o ajuste fino de los agentes. Los resultados de simulación obtenidos han demostrado la efectividad y generalizabilidad de nuestro marco MARL propuesto para la navegación cooperativa de UAV.