Asignación de Tareas de Múltiples Vehículos Aéreos No Tripulados Basada en Aprendizaje por Refuerzo de Transferencia Profunda
Autores: Yin, Yongfeng; Guo, Yang; Su, Qingran; Wang, Zhetao
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Asignación de Tareas de Múltiples Vehículos Aéreos No Tripulados Basada en Aprendizaje por Refuerzo de Transferencia Profunda
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Desarrollo
Tecnología de UAV
Asignación de tareas
Múltiples UAV
Aprendizaje por refuerzo de transferencia profunda
Algoritmo QMIX
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Con el desarrollo de la tecnología de UAV, el problema de asignación de tareas de múltiples UAV es notable, pero la mayoría de estos métodos heurísticos existentes son propensos a caer en el problema de optimización local. Ante esta limitación, se aplica el aprendizaje por refuerzo de transferencia profunda al problema de asignación de tareas de múltiples vehículos aéreos no tripulados, lo que proporciona una nueva idea para resolver este tipo de problema. Se diseña el algoritmo de aprendizaje por refuerzo de migración profunda basado en QMIX. El algoritmo primero compara la tarea objetivo con la tarea fuente en la base de estrategias para encontrar la tarea con la mayor similitud, y luego migra los parámetros de la red obtenidos de la tarea fuente después del entrenamiento, almacenados en la base de estrategias, para acelerar la convergencia del algoritmo QMIX. Los resultados de simulación muestran que el algoritmo propuesto es significativamente mejor que el método heurístico tradicional de asignación en términos de eficiencia y tiene el mismo tiempo de ejecución.
Descripción
Con el desarrollo de la tecnología de UAV, el problema de asignación de tareas de múltiples UAV es notable, pero la mayoría de estos métodos heurísticos existentes son propensos a caer en el problema de optimización local. Ante esta limitación, se aplica el aprendizaje por refuerzo de transferencia profunda al problema de asignación de tareas de múltiples vehículos aéreos no tripulados, lo que proporciona una nueva idea para resolver este tipo de problema. Se diseña el algoritmo de aprendizaje por refuerzo de migración profunda basado en QMIX. El algoritmo primero compara la tarea objetivo con la tarea fuente en la base de estrategias para encontrar la tarea con la mayor similitud, y luego migra los parámetros de la red obtenidos de la tarea fuente después del entrenamiento, almacenados en la base de estrategias, para acelerar la convergencia del algoritmo QMIX. Los resultados de simulación muestran que el algoritmo propuesto es significativamente mejor que el método heurístico tradicional de asignación en términos de eficiencia y tiene el mismo tiempo de ejecución.