Planificación de ruta inteligente para patrullaje de UAV en entornos dinámicos basada en la arquitectura Transformer
Autores: Yu, Ching-Hao; Tsai, Jichiang; Chang, Yuan-Tsun
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Planificación de ruta inteligente para patrullaje de UAV en entornos dinámicos basada en la arquitectura Transformer
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Problema del vendedor viajero
Algoritmo
Tecnología de IA generativa
Entornos dinámicos
Vehículo aéreo no tripulado
Aprendizaje profundo por refuerzo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 44
Citaciones: Sin citaciones
Debido a su propiedad NP-Hard, el Problema del Vendedor Viajero (TSP) ha sido durante mucho tiempo un tema de investigación prominente en la planificación de rutas. El objetivo es diseñar el algoritmo con la velocidad de ejecución más rápida para encontrar la ruta con el menor costo de viaje. En particular, la nueva tecnología generativa de IA está emergiendo continuamente. La pregunta de cómo aprovechar los algoritmos de este ámbito para realizar la planificación de rutas TSP, especialmente en entornos dinámicos, es un problema importante e interesante. El escenario de aplicación de TSP investigado por este documento es el de un Vehículo Aéreo No Tripulado (UAV) que necesita patrullar todos los objetivos de barcos específicos en la superficie del mar antes de regresar a su origen. Por lo tanto, durante el vuelo, debemos considerar los cambios en tiempo real en la velocidad y dirección del viento, así como la adición o eliminación dinámica de objetivos de barcos debido a los requisitos de la misión. Específicamente, implementamos un modelo de Aprendizaje Profundo por Refuerzo (DRL) basado en la arquitectura Transformer, que se utiliza ampliamente en IA Generativa, para resolver el problema de planificación de rutas TSP en entornos dinámicos. Finalmente, realizamos numerosos experimentos de simulación para comparar el rendimiento de nuestro modelo DRL y el algoritmo heurístico tradicional, el método de Recocido Simulado (SA), en términos de tiempo de operación y distancia de ruta en la resolución del TSP ordinario, para verificar las ventajas de nuestro modelo. Es importante destacar que los algoritmos heurísticos tradicionales no pueden aplicarse a entornos dinámicos, en los que la velocidad y dirección del viento pueden cambiar en cualquier momento.
Descripción
Debido a su propiedad NP-Hard, el Problema del Vendedor Viajero (TSP) ha sido durante mucho tiempo un tema de investigación prominente en la planificación de rutas. El objetivo es diseñar el algoritmo con la velocidad de ejecución más rápida para encontrar la ruta con el menor costo de viaje. En particular, la nueva tecnología generativa de IA está emergiendo continuamente. La pregunta de cómo aprovechar los algoritmos de este ámbito para realizar la planificación de rutas TSP, especialmente en entornos dinámicos, es un problema importante e interesante. El escenario de aplicación de TSP investigado por este documento es el de un Vehículo Aéreo No Tripulado (UAV) que necesita patrullar todos los objetivos de barcos específicos en la superficie del mar antes de regresar a su origen. Por lo tanto, durante el vuelo, debemos considerar los cambios en tiempo real en la velocidad y dirección del viento, así como la adición o eliminación dinámica de objetivos de barcos debido a los requisitos de la misión. Específicamente, implementamos un modelo de Aprendizaje Profundo por Refuerzo (DRL) basado en la arquitectura Transformer, que se utiliza ampliamente en IA Generativa, para resolver el problema de planificación de rutas TSP en entornos dinámicos. Finalmente, realizamos numerosos experimentos de simulación para comparar el rendimiento de nuestro modelo DRL y el algoritmo heurístico tradicional, el método de Recocido Simulado (SA), en términos de tiempo de operación y distancia de ruta en la resolución del TSP ordinario, para verificar las ventajas de nuestro modelo. Es importante destacar que los algoritmos heurísticos tradicionales no pueden aplicarse a entornos dinámicos, en los que la velocidad y dirección del viento pueden cambiar en cualquier momento.