Navegación Cooperativa de Enjambres Usando Entrenamiento Centralizado y Ejecución Descentralizada

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Navegación Cooperativa de Enjambres Usando Entrenamiento Centralizado y Ejecución Descentralizada

Autores: Azzam, Rana; Boiko, Igor; Zweiri, Yahya

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico

2023

Navegación Cooperativa de Enjambres Usando Entrenamiento Centralizado y Ejecución Descentralizada

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Operaciones de enjambres de UAV autónomos

Aprendizaje por refuerzo multiagente

Tareas colaborativas

Escalable

En tiempo real

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

La demanda de operaciones de enjambres de UAV autónomos ha ido en aumento tras el éxito de los UAV en diversas tareas desafiantes. Sin embargo, los enfoques convencionales de control de enjambres son inadecuados para hacer frente a la escalabilidad del enjambre, los requisitos computacionales y el rendimiento en tiempo real. En este artículo, demostramos la capacidad de los enfoques emergentes de aprendizaje por refuerzo multiagente (MARL) para tomar decisiones secuenciales de manera exitosa y eficiente durante tareas colaborativas de enjambres de UAV. Proponemos un enfoque MARL escalable y en tiempo real para la navegación colaborativa de UAV, donde los miembros del enjambre deben llegar a ubicaciones objetivo al mismo tiempo. Se utilizan entrenamiento centralizado y ejecución descentralizada (CTDE) para lograr esto, donde se emplea una combinación de refuerzo negativo y positivo en la función de recompensa. Se utiliza el aprendizaje por currículos para facilitar el rendimiento buscado, especialmente debido a la alta complejidad del problema que requiere una exploración extensa. Se utiliza un modelo de UAV que se asemeja mucho a la plataforma física respectiva para entrenar el marco propuesto y hacer que el entrenamiento y las pruebas sean realistas. La escalabilidad de la plataforma a varios tamaños de enjambre, velocidades, posiciones objetivo, dimensiones del entorno y masas de UAV se ha demostrado en (1) un escenario de entrega de carga y (2) formación de enjambres de UAV sin requerir ningún reentrenamiento o ajuste fino de los agentes. Los resultados de simulación obtenidos han demostrado la efectividad y generalizabilidad de nuestro marco MARL propuesto para la navegación cooperativa de UAV.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro