Un algoritmo de optimización de gaviotas impulsado por aprendizaje profundo por refuerzo para resolver el problema de asignación de tareas multi-UAV en la restauración ecológica de mesetas
Autores: Qin, Lijing; Zhou, Zhao; Liu, Huan; Yan, Zhengang; Dai, Yongqiang
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Un algoritmo de optimización de gaviotas impulsado por aprendizaje profundo por refuerzo para resolver el problema de asignación de tareas multi-UAV en la restauración ecológica de mesetas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Avances rápidos
Vehículo aéreo no tripulado
Sistemas multi-UAV
Agricultura
Restauración ecológica
Asignación colaborativa de tareas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El rápido avance de la tecnología de vehículos aéreos no tripulados (VANT) ha permitido la operación coordinada de sistemas multi-VANT, ofreciendo aplicaciones significativas en agricultura, logística, monitoreo ambiental y ayuda en desastres. En agricultura, los VANT se utilizan ampliamente para tareas como la restauración ecológica, el monitoreo de cultivos y la fertilización, proporcionando soluciones eficientes y rentables para mejorar la productividad y la sostenibilidad. Este estudio aborda el problema de asignación colaborativa de tareas para sistemas multi-VANT, utilizando la restauración de praderas ecológicas como un estudio de caso. Se desarrolló un modelo de problema de asignación colaborativa de tareas multi-objetivo y multi-restricción (MOMCCTAP), incorporando restricciones como la colaboración entre VANT, las prioridades de finalización de tareas y las restricciones de rango máximo. Los objetivos de optimización incluyen minimizar el tiempo máximo de finalización de tareas para cualquier VANT y minimizar el tiempo total para todos los VANT. Para resolver este modelo, se propone un algoritmo de optimización de gaviotas basado en aprendizaje por refuerzo profundo (DRL-SOA), que integra el aprendizaje por refuerzo profundo con el algoritmo de optimización de gaviotas (SOA) para una optimización adaptativa. El algoritmo mejora tanto las capacidades de búsqueda global como local al optimizar fases clave de la migración de gaviotas, el ataque y el refinamiento posterior al ataque. La evaluación frente a cinco algoritmos avanzados de inteligencia de enjambre demuestra que el DRL-SOA supera a las alternativas en velocidad de convergencia y diversidad de soluciones, validando su eficacia para resolver el MOMCCTAP.
Descripción
El rápido avance de la tecnología de vehículos aéreos no tripulados (VANT) ha permitido la operación coordinada de sistemas multi-VANT, ofreciendo aplicaciones significativas en agricultura, logística, monitoreo ambiental y ayuda en desastres. En agricultura, los VANT se utilizan ampliamente para tareas como la restauración ecológica, el monitoreo de cultivos y la fertilización, proporcionando soluciones eficientes y rentables para mejorar la productividad y la sostenibilidad. Este estudio aborda el problema de asignación colaborativa de tareas para sistemas multi-VANT, utilizando la restauración de praderas ecológicas como un estudio de caso. Se desarrolló un modelo de problema de asignación colaborativa de tareas multi-objetivo y multi-restricción (MOMCCTAP), incorporando restricciones como la colaboración entre VANT, las prioridades de finalización de tareas y las restricciones de rango máximo. Los objetivos de optimización incluyen minimizar el tiempo máximo de finalización de tareas para cualquier VANT y minimizar el tiempo total para todos los VANT. Para resolver este modelo, se propone un algoritmo de optimización de gaviotas basado en aprendizaje por refuerzo profundo (DRL-SOA), que integra el aprendizaje por refuerzo profundo con el algoritmo de optimización de gaviotas (SOA) para una optimización adaptativa. El algoritmo mejora tanto las capacidades de búsqueda global como local al optimizar fases clave de la migración de gaviotas, el ataque y el refinamiento posterior al ataque. La evaluación frente a cinco algoritmos avanzados de inteligencia de enjambre demuestra que el DRL-SOA supera a las alternativas en velocidad de convergencia y diversidad de soluciones, validando su eficacia para resolver el MOMCCTAP.