logo móvil
Contáctanos

Asignación de tareas de enjambres de UAV basada en aprendizaje por refuerzo profundo

Autores: Liu, Bo; Wang, Shulei; Li, Qinghua; Zhao, Xinyang; Pan, Yunqing; Wang, Changhong

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Asignación de tareas de enjambres de UAV basada en aprendizaje por refuerzo profundo


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Aplicaciones
Algoritmo
Escalabilidad
Planificación de misiones
Toma de decisiones
UAV

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Las aplicaciones de enjambres de UAV son críticas para el futuro, y sus capacidades de planificación de misiones y toma de decisiones tienen un impacto directo en su rendimiento. Sin embargo, crear un algoritmo de asignación dinámico y escalable que se pueda aplicar a varios grupos y tareas es un desafío significativo. Para abordar este problema, proponemos el algoritmo de Gradiente de Política Determinista Profunda Multi-Agente Extensible (Ex-MADDPG), que se basa en el marco MADDPG. El algoritmo Ex-MADDPG mejora la robustez y escalabilidad del algoritmo de asignación al incorporar comunicación local, observación de simulación media, un mecanismo de entrenamiento de parámetros sincrónico y un mecanismo de múltiples decisiones escalable. Nuestro enfoque ha sido validado por su efectividad y escalabilidad a través de experimentos de simulación en el Entorno de Partículas Multi-Agente (MPE) y un experimento en el mundo real. En general, nuestros resultados demuestran que el algoritmo Ex-MADDPG es efectivo para manejar varios grupos y tareas y puede escalar bien a medida que aumenta el tamaño del enjambre. Por lo tanto, nuestro algoritmo tiene un gran potencial para la planificación de misiones y la toma de decisiones en aplicaciones de enjambres de UAV.

Otros recursos que podrían interesarte

Temas Virtualpro