Evitación de Colisiones Adaptativa para Múltiples UAVs en Entornos Urbanos
Autores: Zhang, Jinpeng; Zhang, Honghai; Zhou, Jinlun; Hua, Mingzhuang; Zhong, Gang; Liu, Hao
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Evitación de Colisiones Adaptativa para Múltiples UAVs en Entornos Urbanos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Vehículos aéreos no tripulados
Método de evitación de colisiones
Aprendizaje profundo por refuerzo
Marco de resolución
Algoritmo DDPG
Requisitos en tiempo real
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El número creciente de vehículos aéreos no tripulados (VANT) en el espacio aéreo de baja altitud está amenazando seriamente la seguridad del entorno urbano. Este documento propone un método adaptativo de evitación de colisiones para múltiples VANT (mVANT), con el objetivo de proporcionar una guía segura para los VANT en riesgo de colisión. El método propuesto se formula como un marco de resolución de dos capas, teniendo en cuenta ajustes de velocidad y estrategias de reencaminamiento. La primera capa se establece como un modelo de aprendizaje por refuerzo profundo (DRL) con un espacio de estado y un espacio de acción continuos que selecciona de manera adaptativa la estrategia de resolución más adecuada para pares de VANT. La segunda capa se desarrolla como un modelo colaborativo de evitación de colisiones de mVANT, que combina una detección de conflictos tridimensional y un conjunto de resolución de conflictos para llevar a cabo la resolución. Para entrenar el modelo DRL, en este documento se introduce y mejora un algoritmo de gradiente de política determinista profundo (DDPG). Los resultados demuestran que el tiempo promedio requerido para calcular una estrategia es de 0.096 s, la tasa de éxito alcanza el 95.03%, y la distancia de vuelo adicional es de 26.8 m, lo que cumple con los requisitos en tiempo real y proporciona una referencia confiable para la intervención humana. El método propuesto puede adaptarse a varios escenarios, por ejemplo, diferentes números y posiciones de VANT, con interferencias de factores aleatorios. El algoritmo DDPG mejorado también puede mejorar significativamente la velocidad de convergencia y ahorrar tiempo de entrenamiento.
Descripción
El número creciente de vehículos aéreos no tripulados (VANT) en el espacio aéreo de baja altitud está amenazando seriamente la seguridad del entorno urbano. Este documento propone un método adaptativo de evitación de colisiones para múltiples VANT (mVANT), con el objetivo de proporcionar una guía segura para los VANT en riesgo de colisión. El método propuesto se formula como un marco de resolución de dos capas, teniendo en cuenta ajustes de velocidad y estrategias de reencaminamiento. La primera capa se establece como un modelo de aprendizaje por refuerzo profundo (DRL) con un espacio de estado y un espacio de acción continuos que selecciona de manera adaptativa la estrategia de resolución más adecuada para pares de VANT. La segunda capa se desarrolla como un modelo colaborativo de evitación de colisiones de mVANT, que combina una detección de conflictos tridimensional y un conjunto de resolución de conflictos para llevar a cabo la resolución. Para entrenar el modelo DRL, en este documento se introduce y mejora un algoritmo de gradiente de política determinista profundo (DDPG). Los resultados demuestran que el tiempo promedio requerido para calcular una estrategia es de 0.096 s, la tasa de éxito alcanza el 95.03%, y la distancia de vuelo adicional es de 26.8 m, lo que cumple con los requisitos en tiempo real y proporciona una referencia confiable para la intervención humana. El método propuesto puede adaptarse a varios escenarios, por ejemplo, diferentes números y posiciones de VANT, con interferencias de factores aleatorios. El algoritmo DDPG mejorado también puede mejorar significativamente la velocidad de convergencia y ahorrar tiempo de entrenamiento.