Optimizador de Lobo Gris de Q-Learning Adaptativo para la Planificación de Rutas de UAV
Autores: Nayeem, Golam Moktader; Fan, Mingyu; Daiyan, Golam Moktader
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Optimizador de Lobo Gris de Q-Learning Adaptativo para la Planificación de Rutas de UAV
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Planificación de rutas
Vehículos aéreos no tripulados
Algoritmos metaheurísticos
Optimización de Lobo Gris
Algoritmo GWO basado en Q-learning
Algoritmo de optimización bayesiana
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La planificación de rutas es crucial para navegar de manera segura y eficiente vehículos aéreos no tripulados (UAV) hacia objetivos operativos. A menudo, este es un problema complejo de optimización no lineal y con múltiples restricciones, y se utilizan frecuentemente algoritmos metaheurísticos para resolverlo. La Optimización por Lobos Grises (GWO) es uno de los algoritmos más populares para resolver tales problemas. Sin embargo, el GWO estándar tiene varias limitaciones, como la convergencia prematura, la susceptibilidad a mínimos locales y la inadecuación para entornos dinámicos debido a su falta de aprendizaje adaptativo. Proponemos un algoritmo GWO basado en Q-learning para abordar estos problemas en este estudio. QGWO introduce cuatro características clave: un factor de convergencia adaptativo basado en Q-learning, una estrategia de actualización de posición segmentada y parametrizada, un mecanismo de salto largo para la preservación de la diversidad de la población y el reemplazo de lobos no dominantes para mejorar la exploración. Además, se utiliza el algoritmo de optimización bayesiana para establecer parámetros en QGWO para un mejor rendimiento. Para evaluar la calidad y robustez de QGWO, se realizaron extensos experimentos numéricos y de simulación en funciones de referencia del IEEE CEC 2022, comparándolo con el GWO estándar y algunas de sus variantes recientes. En la simulación de planificación de rutas, QGWO reduce el costo de la ruta en un 27.4%, mejora la velocidad de convergencia en un 19.06% y reduce el área bajo la curva (AUC) en un 23.8% en comparación con el GWO estándar, logrando una trayectoria óptima. Los resultados muestran que QGWO es un algoritmo eficiente y confiable para la planificación de rutas de UAV en entornos dinámicos.
Descripción
La planificación de rutas es crucial para navegar de manera segura y eficiente vehículos aéreos no tripulados (UAV) hacia objetivos operativos. A menudo, este es un problema complejo de optimización no lineal y con múltiples restricciones, y se utilizan frecuentemente algoritmos metaheurísticos para resolverlo. La Optimización por Lobos Grises (GWO) es uno de los algoritmos más populares para resolver tales problemas. Sin embargo, el GWO estándar tiene varias limitaciones, como la convergencia prematura, la susceptibilidad a mínimos locales y la inadecuación para entornos dinámicos debido a su falta de aprendizaje adaptativo. Proponemos un algoritmo GWO basado en Q-learning para abordar estos problemas en este estudio. QGWO introduce cuatro características clave: un factor de convergencia adaptativo basado en Q-learning, una estrategia de actualización de posición segmentada y parametrizada, un mecanismo de salto largo para la preservación de la diversidad de la población y el reemplazo de lobos no dominantes para mejorar la exploración. Además, se utiliza el algoritmo de optimización bayesiana para establecer parámetros en QGWO para un mejor rendimiento. Para evaluar la calidad y robustez de QGWO, se realizaron extensos experimentos numéricos y de simulación en funciones de referencia del IEEE CEC 2022, comparándolo con el GWO estándar y algunas de sus variantes recientes. En la simulación de planificación de rutas, QGWO reduce el costo de la ruta en un 27.4%, mejora la velocidad de convergencia en un 19.06% y reduce el área bajo la curva (AUC) en un 23.8% en comparación con el GWO estándar, logrando una trayectoria óptima. Los resultados muestran que QGWO es un algoritmo eficiente y confiable para la planificación de rutas de UAV en entornos dinámicos.