Marco de Planificación de Rutas Jerárquicas y Evitación de Obstáculos Inteligente Basada en Agentes MMDQN para UAVs
Autores: Dong, Boyu; Zhang, Yuzhen; Yuan, Peiyuan; Lu, Shuntong; Huang, Tao; Zhang, Gong
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Marco de Planificación de Rutas Jerárquicas y Evitación de Obstáculos Inteligente Basada en Agentes MMDQN para UAVs
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Tecnología de planificación de rutas eficiente
Vehículo aéreo no tripulado
Planificación de rutas global
Evitación de obstáculos
Aprendizaje por refuerzo profundo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La tecnología de planificación de rutas eficiente es el soporte fundamental para garantizar la ejecución exitosa de misiones de vuelo de vehículos aéreos no tripulados (VANT). En este documento, se estudia el problema de coordinación de la planificación de rutas globales y la evitación de obstáculos en tiempo real a nivel local en entornos montañosos complejos. Para abordar este problema, se diseña un marco de planificación de rutas jerárquico, que incluye la planificación de rutas globales y la re-planificación de rutas locales basada en inteligencia artificial utilizando aprendizaje por refuerzo profundo, exhibiendo tanto versatilidad flexible como eficiencia práctica en la coordinación y despliegue. A lo largo de todo el vuelo, la tarea de re-planificación de rutas locales desencadenada por amenazas dinámicas puede ejecutarse en tiempo real. Mientras tanto, se diseña un agente DQN de múltiples modelos (MMDQN) con una estrategia de aprendizaje iterativo de Monte Carlo (MCTIL) para la re-planificación de rutas locales. En comparación con los métodos existentes, este agente puede utilizarse directamente para generar rutas de evitación de obstáculos locales en varios escenarios en cualquier momento durante el vuelo, lo que simplifica la estructura complicada y el proceso de entrenamiento de los agentes de aprendizaje por refuerzo profundo (DRL) convencionales en entornos dinámicos y complejos. El uso de la estructura del marco y el agente MMDQN para la re-planificación de rutas locales garantiza la seguridad y eficiencia de la misión, así como la evitación de obstáculos locales durante los vuelos globales. Estas prestaciones se verifican a través de simulaciones basadas en datos de terreno reales.
Descripción
La tecnología de planificación de rutas eficiente es el soporte fundamental para garantizar la ejecución exitosa de misiones de vuelo de vehículos aéreos no tripulados (VANT). En este documento, se estudia el problema de coordinación de la planificación de rutas globales y la evitación de obstáculos en tiempo real a nivel local en entornos montañosos complejos. Para abordar este problema, se diseña un marco de planificación de rutas jerárquico, que incluye la planificación de rutas globales y la re-planificación de rutas locales basada en inteligencia artificial utilizando aprendizaje por refuerzo profundo, exhibiendo tanto versatilidad flexible como eficiencia práctica en la coordinación y despliegue. A lo largo de todo el vuelo, la tarea de re-planificación de rutas locales desencadenada por amenazas dinámicas puede ejecutarse en tiempo real. Mientras tanto, se diseña un agente DQN de múltiples modelos (MMDQN) con una estrategia de aprendizaje iterativo de Monte Carlo (MCTIL) para la re-planificación de rutas locales. En comparación con los métodos existentes, este agente puede utilizarse directamente para generar rutas de evitación de obstáculos locales en varios escenarios en cualquier momento durante el vuelo, lo que simplifica la estructura complicada y el proceso de entrenamiento de los agentes de aprendizaje por refuerzo profundo (DRL) convencionales en entornos dinámicos y complejos. El uso de la estructura del marco y el agente MMDQN para la re-planificación de rutas locales garantiza la seguridad y eficiencia de la misión, así como la evitación de obstáculos locales durante los vuelos globales. Estas prestaciones se verifican a través de simulaciones basadas en datos de terreno reales.