Tarea de asignación para ataque de saturación de enjambre de UAV: un enfoque de aprendizaje profundo por refuerzo
Autores: Qian, Feng; Su, Kai; Liang, Xin; Zhang, Kan
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Tarea de asignación para ataque de saturación de enjambre de UAV: un enfoque de aprendizaje profundo por refuerzo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Asignación de tareas
Vehículo aéreo no tripulado
Enjambre de UAV
Ataque de saturación
Aprendizaje profundo por refuerzo
Red neuronal de políticas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
La asignación de tareas es un problema desafiante en múltiples misiones de vehículos aéreos no tripulados (UAV). En este artículo, nos enfocamos en el problema de asignación de tareas para un ataque de saturación de enjambre de UAV, en el que se desarrolla un marco de aprendizaje profundo por refuerzo (DRL). Específicamente, primero construimos un modelo matemático para formular el problema de asignación de tareas para un ataque de saturación de enjambre de UAV y lo consideramos como un Proceso de Decisión de Markov (MDP). Luego diseñamos una red neuronal de política utilizando el mecanismo de atención. También proponemos un algoritmo de entrenamiento basado en el método de gradiente de política para que nuestro agente pueda aprender una política efectiva de asignación de tareas. Los resultados experimentales han demostrado que nuestro método DRL puede generar soluciones de alta calidad para diferentes escalas de problemas, lo que cumple con los requisitos de tiempo real y flexibilidad en la situación real.
Descripción
La asignación de tareas es un problema desafiante en múltiples misiones de vehículos aéreos no tripulados (UAV). En este artículo, nos enfocamos en el problema de asignación de tareas para un ataque de saturación de enjambre de UAV, en el que se desarrolla un marco de aprendizaje profundo por refuerzo (DRL). Específicamente, primero construimos un modelo matemático para formular el problema de asignación de tareas para un ataque de saturación de enjambre de UAV y lo consideramos como un Proceso de Decisión de Markov (MDP). Luego diseñamos una red neuronal de política utilizando el mecanismo de atención. También proponemos un algoritmo de entrenamiento basado en el método de gradiente de política para que nuestro agente pueda aprender una política efectiva de asignación de tareas. Los resultados experimentales han demostrado que nuestro método DRL puede generar soluciones de alta calidad para diferentes escalas de problemas, lo que cumple con los requisitos de tiempo real y flexibilidad en la situación real.