Toma de decisiones basada en modelos de aprendizaje por refuerzo para vehículos aéreos no tripulados (UAV) que operan en condiciones de visibilidad degradada y sin GNSS, con capacidades de sensor limitadas
Autores: Boiteau, Sebastien; Vanegas, Fernando; Galvez-Serna, Julian; Gonzalez, Felipe
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Toma de decisiones basada en modelos de aprendizaje por refuerzo para vehículos aéreos no tripulados (UAV) que operan en condiciones de visibilidad degradada y sin GNSS, con capacidades de sensor limitadas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Autonomía
Vehículo aéreo no tripulado
Navegación
Aprendizaje por refuerzo
Sensores
Evitación de obstáculos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La autonomía en la navegación de vehículos aéreos no tripulados (UAV) ha permitido aplicaciones en diversos campos como la minería, la agricultura de precisión y la exploración planetaria. Sin embargo, las aplicaciones desafiantes en entornos complejos complican la interacción entre el agente y su entorno. Condiciones como la ausencia de un sistema de navegación por satélite global (GNSS), baja visibilidad y entornos desordenados aumentan significativamente los niveles de incertidumbre y causan observabilidad parcial. Estos desafíos crecen cuando se emplean sensores compactos, de bajo costo y de nivel de entrada. Este estudio propone un enfoque de aprendizaje por refuerzo (RL) basado en modelos para permitir que los UAV naveguen y tomen decisiones de manera autónoma en entornos donde el GNSS no está disponible y la visibilidad es limitada. Diseñado para operaciones de búsqueda y rescate, el sistema permite a los UAV navegar en entornos interiores desordenados, detectar objetivos y evitar obstáculos en condiciones de baja visibilidad. La arquitectura integra sensores a bordo, incluyendo una cámara térmica para detectar a una persona colapsada (objetivo), un LiDAR 2D y un IMU para la localización. El módulo de toma de decisiones emplea el solucionador ABT para el cálculo de políticas en tiempo real. El marco presentado en este trabajo se basa en sensores de bajo costo y de nivel de entrada, lo que lo hace adecuado para plataformas UAV ligeras. Los resultados experimentales demuestran altas tasas de éxito en la detección de objetivos y un rendimiento robusto en la evitación de obstáculos y navegación a pesar de las incertidumbres en la estimación de pose y detección. El sistema propuesto fue evaluado primero en simulación, comparado con un algoritmo base, y luego a través de pruebas en la vida real en varios escenarios. El sistema propuesto representa un avance en la autonomía de los UAV para aplicaciones críticas, con posibles extensiones a entornos desconocidos y completamente estocásticos.
Descripción
La autonomía en la navegación de vehículos aéreos no tripulados (UAV) ha permitido aplicaciones en diversos campos como la minería, la agricultura de precisión y la exploración planetaria. Sin embargo, las aplicaciones desafiantes en entornos complejos complican la interacción entre el agente y su entorno. Condiciones como la ausencia de un sistema de navegación por satélite global (GNSS), baja visibilidad y entornos desordenados aumentan significativamente los niveles de incertidumbre y causan observabilidad parcial. Estos desafíos crecen cuando se emplean sensores compactos, de bajo costo y de nivel de entrada. Este estudio propone un enfoque de aprendizaje por refuerzo (RL) basado en modelos para permitir que los UAV naveguen y tomen decisiones de manera autónoma en entornos donde el GNSS no está disponible y la visibilidad es limitada. Diseñado para operaciones de búsqueda y rescate, el sistema permite a los UAV navegar en entornos interiores desordenados, detectar objetivos y evitar obstáculos en condiciones de baja visibilidad. La arquitectura integra sensores a bordo, incluyendo una cámara térmica para detectar a una persona colapsada (objetivo), un LiDAR 2D y un IMU para la localización. El módulo de toma de decisiones emplea el solucionador ABT para el cálculo de políticas en tiempo real. El marco presentado en este trabajo se basa en sensores de bajo costo y de nivel de entrada, lo que lo hace adecuado para plataformas UAV ligeras. Los resultados experimentales demuestran altas tasas de éxito en la detección de objetivos y un rendimiento robusto en la evitación de obstáculos y navegación a pesar de las incertidumbres en la estimación de pose y detección. El sistema propuesto fue evaluado primero en simulación, comparado con un algoritmo base, y luego a través de pruebas en la vida real en varios escenarios. El sistema propuesto representa un avance en la autonomía de los UAV para aplicaciones críticas, con posibles extensiones a entornos desconocidos y completamente estocásticos.