Asignación de tareas de enjambres de UAV basada en aprendizaje por refuerzo profundo
Autores: Liu, Bo; Wang, Shulei; Li, Qinghua; Zhao, Xinyang; Pan, Yunqing; Wang, Changhong
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Asignación de tareas de enjambres de UAV basada en aprendizaje por refuerzo profundo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Aplicaciones
Algoritmo
Escalabilidad
Planificación de misiones
Toma de decisiones
UAV
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Las aplicaciones de enjambres de UAV son críticas para el futuro, y sus capacidades de planificación de misiones y toma de decisiones tienen un impacto directo en su rendimiento. Sin embargo, crear un algoritmo de asignación dinámico y escalable que se pueda aplicar a varios grupos y tareas es un desafío significativo. Para abordar este problema, proponemos el algoritmo de Gradiente de Política Determinista Profunda Multi-Agente Extensible (Ex-MADDPG), que se basa en el marco MADDPG. El algoritmo Ex-MADDPG mejora la robustez y escalabilidad del algoritmo de asignación al incorporar comunicación local, observación de simulación media, un mecanismo de entrenamiento de parámetros sincrónico y un mecanismo de múltiples decisiones escalable. Nuestro enfoque ha sido validado por su efectividad y escalabilidad a través de experimentos de simulación en el Entorno de Partículas Multi-Agente (MPE) y un experimento en el mundo real. En general, nuestros resultados demuestran que el algoritmo Ex-MADDPG es efectivo para manejar varios grupos y tareas y puede escalar bien a medida que aumenta el tamaño del enjambre. Por lo tanto, nuestro algoritmo tiene un gran potencial para la planificación de misiones y la toma de decisiones en aplicaciones de enjambres de UAV.
Descripción
Las aplicaciones de enjambres de UAV son críticas para el futuro, y sus capacidades de planificación de misiones y toma de decisiones tienen un impacto directo en su rendimiento. Sin embargo, crear un algoritmo de asignación dinámico y escalable que se pueda aplicar a varios grupos y tareas es un desafío significativo. Para abordar este problema, proponemos el algoritmo de Gradiente de Política Determinista Profunda Multi-Agente Extensible (Ex-MADDPG), que se basa en el marco MADDPG. El algoritmo Ex-MADDPG mejora la robustez y escalabilidad del algoritmo de asignación al incorporar comunicación local, observación de simulación media, un mecanismo de entrenamiento de parámetros sincrónico y un mecanismo de múltiples decisiones escalable. Nuestro enfoque ha sido validado por su efectividad y escalabilidad a través de experimentos de simulación en el Entorno de Partículas Multi-Agente (MPE) y un experimento en el mundo real. En general, nuestros resultados demuestran que el algoritmo Ex-MADDPG es efectivo para manejar varios grupos y tareas y puede escalar bien a medida que aumenta el tamaño del enjambre. Por lo tanto, nuestro algoritmo tiene un gran potencial para la planificación de misiones y la toma de decisiones en aplicaciones de enjambres de UAV.