Navegación Autónoma de UAV Basada en Aprendizaje por Refuerzo Profundo en Entornos Altamente Dinámicos y de Alta Densidad
Autores: Sheng, Yuanyuan; Liu, Huanyu; Li, Junbao; Han, Qi
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Navegación Autónoma de UAV Basada en Aprendizaje por Refuerzo Profundo en Entornos Altamente Dinámicos y de Alta Densidad
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Navegación autónoma
Vehículos aéreos no tripulados
Aprendizaje profundo por refuerzo
Entornos complejos
Planificación de rutas
Función de recompensa dinámica
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La navegación autónoma de vehículos aéreos no tripulados (VANT) basada en el aprendizaje por refuerzo profundo (DRL) ha avanzado considerablemente. Sin embargo, la mayoría de los estudios asumen escenarios de tareas relativamente simples y no consideran el impacto de escenarios de tareas complejos en el rendimiento de vuelo de los VANT. Este artículo propone un algoritmo de navegación autónoma basado en DRL para VANT, que permite la planificación autónoma de rutas en entornos de alta densidad y altamente dinámicos. Este algoritmo propone un método de representación del espacio de estados que contiene información de posición e información de ángulo al analizar el impacto de los cambios de posición y de ángulo de los VANT en el rendimiento de navegación en entornos complejos. Además, se construye una función de recompensa dinámica basada en una función de recompensa no dispersa para equilibrar el comportamiento conservador y el comportamiento exploratorio del agente durante el proceso de entrenamiento del modelo. Los resultados de múltiples experimentos comparativos muestran que el algoritmo propuesto no solo tiene el mejor rendimiento de navegación autónoma, sino que también presenta la eficiencia de vuelo óptima en entornos complejos.
Descripción
La navegación autónoma de vehículos aéreos no tripulados (VANT) basada en el aprendizaje por refuerzo profundo (DRL) ha avanzado considerablemente. Sin embargo, la mayoría de los estudios asumen escenarios de tareas relativamente simples y no consideran el impacto de escenarios de tareas complejos en el rendimiento de vuelo de los VANT. Este artículo propone un algoritmo de navegación autónoma basado en DRL para VANT, que permite la planificación autónoma de rutas en entornos de alta densidad y altamente dinámicos. Este algoritmo propone un método de representación del espacio de estados que contiene información de posición e información de ángulo al analizar el impacto de los cambios de posición y de ángulo de los VANT en el rendimiento de navegación en entornos complejos. Además, se construye una función de recompensa dinámica basada en una función de recompensa no dispersa para equilibrar el comportamiento conservador y el comportamiento exploratorio del agente durante el proceso de entrenamiento del modelo. Los resultados de múltiples experimentos comparativos muestran que el algoritmo propuesto no solo tiene el mejor rendimiento de navegación autónoma, sino que también presenta la eficiencia de vuelo óptima en entornos complejos.