Tecnología de Programación Inteligente del Algoritmo de Inteligencia de Enjambre para la Planificación de Rutas de Drones
Autores: Meng, Zhipeng; Li, Dongze; Zhang, Yong; Yan, Haoquan
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Tecnología de Programación Inteligente del Algoritmo de Inteligencia de Enjambre para la Planificación de Rutas de Drones
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Algoritmo de inteligencia de enjambre
Problemas de optimización
Planificación de rutas
Drones
Tecnología de programación
Aprendizaje profundo Q
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Diferentes tipos de algoritmos de inteligencia de enjambre obtienen un rendimiento superior en la resolución de problemas complejos de optimización y se han utilizado ampliamente en la planificación de rutas de drones. Debido a sus propias características, los resultados de optimización pueden variar considerablemente en diferentes entornos dinámicos. En este artículo, se propone una tecnología de programación para algoritmos de inteligencia de enjambre basada en el aprendizaje profundo por refuerzo Q para seleccionar inteligentemente algoritmos que realicen la planificación de rutas en 3D. Se construye una base de datos única de puntos de ruta y se proponen dos principios básicos para guiar el entrenamiento del modelo. La planificación de rutas y el aprendizaje de la red se separan mediante el principio de separación propuesto y el principio de selección óptima asegura la convergencia del modelo. Enfocándose en el problema de la escasez de recompensas, el costo integral de cada punto de ruta en toda la secuencia de la pista se considera como una recompensa dinámica. A través de la investigación de condiciones del entorno dinámico, como diferentes distancias y amenazas, se valida la efectividad del método propuesto.
Descripción
Diferentes tipos de algoritmos de inteligencia de enjambre obtienen un rendimiento superior en la resolución de problemas complejos de optimización y se han utilizado ampliamente en la planificación de rutas de drones. Debido a sus propias características, los resultados de optimización pueden variar considerablemente en diferentes entornos dinámicos. En este artículo, se propone una tecnología de programación para algoritmos de inteligencia de enjambre basada en el aprendizaje profundo por refuerzo Q para seleccionar inteligentemente algoritmos que realicen la planificación de rutas en 3D. Se construye una base de datos única de puntos de ruta y se proponen dos principios básicos para guiar el entrenamiento del modelo. La planificación de rutas y el aprendizaje de la red se separan mediante el principio de separación propuesto y el principio de selección óptima asegura la convergencia del modelo. Enfocándose en el problema de la escasez de recompensas, el costo integral de cada punto de ruta en toda la secuencia de la pista se considera como una recompensa dinámica. A través de la investigación de condiciones del entorno dinámico, como diferentes distancias y amenazas, se valida la efectividad del método propuesto.