Investigación sobre la Programación de Tareas de Comunicación de Retorno para Enjambres de UAV en Escenarios de Ayuda en Desastres
Autores: Tang, Zhangquan; Jiao, Yuanyuan; Wang, Xiao; Pan, Xiaogang; Peng, Jiawu
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Investigación sobre la Programación de Tareas de Comunicación de Retorno para Enjambres de UAV en Escenarios de Ayuda en Desastres
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Programación
Tareas de comunicación de retorno
Vehículo aéreo no tripulado
Enjambres
Dueling DQN-ALNS
Algoritmo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Este estudio investiga el problema de programación de tareas de comunicación de retorno para enjambres de vehículos aéreos no tripulados (UAV), donde la localización global ambiental para ayuda en desastres se ve obstaculizada. Para caracterizar la utilidad de estas tareas y optimizar las decisiones de programación, desarrollamos un modelo de programación con restricciones de ventana de tiempo que opera bajo limitaciones, incluyendo ventanas de tiempo de estaciones base de comunicación, niveles de batería y singularidad de tareas. Para resolver el modelo anterior, proponemos un algoritmo mejorado mediante la integración de Dueling Deep Q-Network (Dueling DQN) en la búsqueda adaptativa de grandes vecindarios (ALNS), denominado Dueling DQN-ALNS. El componente Dueling DQN desarrolla un método para actualizar los pesos de estrategia, mientras que el espacio de acción define las estrategias de destrucción y selección para la solución de programación ALNS a través de diferentes ventanas de tiempo. Mientras tanto, diseñamos un marco de algoritmo de dos etapas que consiste en entrenamiento centralizado fuera de línea y programación descentralizada en línea. En comparación con los algoritmos de búsqueda optimizados tradicionalmente, el algoritmo propuesto podría interactuar de manera continua y dinámica con el entorno para adquirir información sobre el estado de la solución de programación. La capacidad de solución de Dueling DQN es un 3.75% superior a la del algoritmo de Optimización por Colonias de Hormigas (ACO), un 5.9% superior a la del algoritmo básico ALNS y un 9.37% superior a la del algoritmo de evolución diferencial (DE). Esto verificó su eficiencia y ventajas en el problema de programación de tareas de comunicación de retorno para UAVs.
Descripción
Este estudio investiga el problema de programación de tareas de comunicación de retorno para enjambres de vehículos aéreos no tripulados (UAV), donde la localización global ambiental para ayuda en desastres se ve obstaculizada. Para caracterizar la utilidad de estas tareas y optimizar las decisiones de programación, desarrollamos un modelo de programación con restricciones de ventana de tiempo que opera bajo limitaciones, incluyendo ventanas de tiempo de estaciones base de comunicación, niveles de batería y singularidad de tareas. Para resolver el modelo anterior, proponemos un algoritmo mejorado mediante la integración de Dueling Deep Q-Network (Dueling DQN) en la búsqueda adaptativa de grandes vecindarios (ALNS), denominado Dueling DQN-ALNS. El componente Dueling DQN desarrolla un método para actualizar los pesos de estrategia, mientras que el espacio de acción define las estrategias de destrucción y selección para la solución de programación ALNS a través de diferentes ventanas de tiempo. Mientras tanto, diseñamos un marco de algoritmo de dos etapas que consiste en entrenamiento centralizado fuera de línea y programación descentralizada en línea. En comparación con los algoritmos de búsqueda optimizados tradicionalmente, el algoritmo propuesto podría interactuar de manera continua y dinámica con el entorno para adquirir información sobre el estado de la solución de programación. La capacidad de solución de Dueling DQN es un 3.75% superior a la del algoritmo de Optimización por Colonias de Hormigas (ACO), un 5.9% superior a la del algoritmo básico ALNS y un 9.37% superior a la del algoritmo de evolución diferencial (DE). Esto verificó su eficiencia y ventajas en el problema de programación de tareas de comunicación de retorno para UAVs.