Un marco para la navegación autónoma de UAV basado en la estimación de profundidad monocular
Autores: Gaigalas, Jonas; Perkauskas, Linas; Gricius, Henrikas; Kanapickas, Tomas; Kriinas, Andrius
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Un marco para la navegación autónoma de UAV basado en la estimación de profundidad monocular
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Drones no tripulados
Navegación autónoma de drones
Información visual
Mapa de ocupación
Algoritmo de planificación de rutas
Modelos de estimación de profundidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los UAV se utilizan ampliamente en aplicaciones prácticas como reconocimiento y búsqueda y rescate, o en otras misiones que normalmente requieren operadores experimentados. La navegación autónoma de drones podría ayudar en situaciones donde el entorno es desconocido, las señales de GPS o radio no están disponibles y no hay modelos 3D existentes para planificar una trayectoria. Los métodos de navegación tradicionales emplean múltiples sensores: LiDAR, sonar, unidades de medida inercial (IMUs) y cámaras. Esto aumenta el peso y el costo de tales drones. Este trabajo se centra en la navegación autónoma de drones desde el punto A hasta el punto B utilizando información visual obtenida de una cámara monocular en un simulador. La solución utiliza un modelo de estimación de imagen de profundidad para crear un mapa de ocupación del área circundante y utiliza un algoritmo de planificación de rutas A* para encontrar rutas óptimas hacia los objetivos finales mientras navega alrededor de los obstáculos. La simulación se lleva a cabo utilizando AirSim en Unreal Engine. Con este trabajo, proponemos un marco y escenarios en tres diferentes entornos virtuales de código abierto, variando en complejidad, para probar y comparar métodos de navegación autónoma de UAV basados en visión. En este estudio, se utilizaron modelos ajustados utilizando datos de imagen RGB y de profundidad sintéticos para cada entorno, demostrando una mejora notable en la precisión de la estimación de profundidad, con reducciones en el Error Porcentual Absoluto Medio (MAPE) del 120.45% al 33.41% en AirSimNH, del 70.09% al 8.04% en Blocks, y del 121.94% al 32.86% en MSBuild2018. Mientras que el marco de navegación autónoma de UAV propuesto que utiliza imágenes de profundidad directamente de AirSim logra tasas de éxito del 38.89%, 87.78% y 13.33% para alcanzar objetivos en los entornos de AirSimNH, Blocks y MSBuild2018, respectivamente, el método con modelos de estimación de profundidad preentrenados no logra alcanzar ningún punto final de los escenarios. Los modelos de estimación de profundidad ajustados mejoran el rendimiento, aumentando el número de objetivos alcanzados en un 3.33% para AirSimNH y un 72.22% para Blocks. Estos hallazgos destacan los beneficios de adaptar modelos basados en visión a entornos específicos, mejorando la autonomía de los UAV en tareas de navegación guiadas visualmente.
Descripción
Los UAV se utilizan ampliamente en aplicaciones prácticas como reconocimiento y búsqueda y rescate, o en otras misiones que normalmente requieren operadores experimentados. La navegación autónoma de drones podría ayudar en situaciones donde el entorno es desconocido, las señales de GPS o radio no están disponibles y no hay modelos 3D existentes para planificar una trayectoria. Los métodos de navegación tradicionales emplean múltiples sensores: LiDAR, sonar, unidades de medida inercial (IMUs) y cámaras. Esto aumenta el peso y el costo de tales drones. Este trabajo se centra en la navegación autónoma de drones desde el punto A hasta el punto B utilizando información visual obtenida de una cámara monocular en un simulador. La solución utiliza un modelo de estimación de imagen de profundidad para crear un mapa de ocupación del área circundante y utiliza un algoritmo de planificación de rutas A* para encontrar rutas óptimas hacia los objetivos finales mientras navega alrededor de los obstáculos. La simulación se lleva a cabo utilizando AirSim en Unreal Engine. Con este trabajo, proponemos un marco y escenarios en tres diferentes entornos virtuales de código abierto, variando en complejidad, para probar y comparar métodos de navegación autónoma de UAV basados en visión. En este estudio, se utilizaron modelos ajustados utilizando datos de imagen RGB y de profundidad sintéticos para cada entorno, demostrando una mejora notable en la precisión de la estimación de profundidad, con reducciones en el Error Porcentual Absoluto Medio (MAPE) del 120.45% al 33.41% en AirSimNH, del 70.09% al 8.04% en Blocks, y del 121.94% al 32.86% en MSBuild2018. Mientras que el marco de navegación autónoma de UAV propuesto que utiliza imágenes de profundidad directamente de AirSim logra tasas de éxito del 38.89%, 87.78% y 13.33% para alcanzar objetivos en los entornos de AirSimNH, Blocks y MSBuild2018, respectivamente, el método con modelos de estimación de profundidad preentrenados no logra alcanzar ningún punto final de los escenarios. Los modelos de estimación de profundidad ajustados mejoran el rendimiento, aumentando el número de objetivos alcanzados en un 3.33% para AirSimNH y un 72.22% para Blocks. Estos hallazgos destacan los beneficios de adaptar modelos basados en visión a entornos específicos, mejorando la autonomía de los UAV en tareas de navegación guiadas visualmente.