Un Optimizador de Puercoespín Crestado basado en Q-Learning para la Planificación de Rutas Adaptativa de UAV
Autores: Liu, Jiandong; He, Yuejun; Shen, Bing; Wang, Jing; Wang, Penggang; Zhang, Guoqing; Zhuang, Xiang; Chen, Ran; Luo, Wei
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Un Optimizador de Puercoespín Crestado basado en Q-Learning para la Planificación de Rutas Adaptativa de UAV
Categoría
Tecnología de Equipos y Accesorios
Subcategoría
Diseño de equipos y herramientas
Palabras clave
Uav
Planificación de rutas
Optimización
Algoritmo
Qcpo
Optimizador de puercoespín crestado
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
La planificación de rutas de vehículos aéreos no tripulados (VANT) es crítica para garantizar la seguridad de vuelo y mejorar la eficiencia en la ejecución de misiones. Este problema se formula típicamente como una tarea de optimización compleja, con múltiples restricciones y no lineal, que a menudo se aborda utilizando algoritmos metaheurísticos. El Optimizador de Puercoespín Crestado (CPO) se ha convertido en un excelente método para resolver este problema; sin embargo, el CPO estándar tiene limitaciones, como la falta de ajuste adaptativo de parámetros para adaptarse a entornos complejos, una convergencia lenta y la tendencia a caer en soluciones óptimas locales. Para abordar estos problemas, este artículo propone un algoritmo llamado QCPO, que integra CPO con Q-learning para mejorar el rendimiento de optimización de rutas de VANT. Se emplea Q-learning para ajustar de manera adaptativa los parámetros clave del CPO, superando así las limitaciones de los ajustes de parámetros fijos tradicionales. Inspirada en los mecanismos de defensa del puercoespín, se introduce una novedosa estrategia de coordinación audiovisual para equilibrar las respuestas visuales y auditivas, acelerando la convergencia en las primeras etapas de optimización. Se diseña un mecanismo de actualización de posición refinado para prevenir tamaños de paso excesivos y violaciones de límites, mejorando la capacidad de búsqueda global del algoritmo. También se incorpora un método de suavizado de trayectorias basado en B-splines para mejorar la viabilidad y suavidad de las rutas planificadas. En este artículo, comparamos QCPO con cuatro heurísticas destacadas, y QCPO logra el costo de ruta más bajo en los tres escenarios de prueba, con reducciones de costo de ruta del 30.23%, 26.41% y 33.47%, respectivamente, en comparación con el CPO estándar. Los resultados experimentales confirman que QCPO ofrece una solución eficiente y segura para la planificación de rutas de VANT.
Descripción
La planificación de rutas de vehículos aéreos no tripulados (VANT) es crítica para garantizar la seguridad de vuelo y mejorar la eficiencia en la ejecución de misiones. Este problema se formula típicamente como una tarea de optimización compleja, con múltiples restricciones y no lineal, que a menudo se aborda utilizando algoritmos metaheurísticos. El Optimizador de Puercoespín Crestado (CPO) se ha convertido en un excelente método para resolver este problema; sin embargo, el CPO estándar tiene limitaciones, como la falta de ajuste adaptativo de parámetros para adaptarse a entornos complejos, una convergencia lenta y la tendencia a caer en soluciones óptimas locales. Para abordar estos problemas, este artículo propone un algoritmo llamado QCPO, que integra CPO con Q-learning para mejorar el rendimiento de optimización de rutas de VANT. Se emplea Q-learning para ajustar de manera adaptativa los parámetros clave del CPO, superando así las limitaciones de los ajustes de parámetros fijos tradicionales. Inspirada en los mecanismos de defensa del puercoespín, se introduce una novedosa estrategia de coordinación audiovisual para equilibrar las respuestas visuales y auditivas, acelerando la convergencia en las primeras etapas de optimización. Se diseña un mecanismo de actualización de posición refinado para prevenir tamaños de paso excesivos y violaciones de límites, mejorando la capacidad de búsqueda global del algoritmo. También se incorpora un método de suavizado de trayectorias basado en B-splines para mejorar la viabilidad y suavidad de las rutas planificadas. En este artículo, comparamos QCPO con cuatro heurísticas destacadas, y QCPO logra el costo de ruta más bajo en los tres escenarios de prueba, con reducciones de costo de ruta del 30.23%, 26.41% y 33.47%, respectivamente, en comparación con el CPO estándar. Los resultados experimentales confirman que QCPO ofrece una solución eficiente y segura para la planificación de rutas de VANT.