YOLO-RWY: Un nuevo modelo de detección de pistas para el aterrizaje autónomo basado en visión de vehículos aéreos no tripulados de ala fija
Autores: Li, Ye; Xia, Yu; Zheng, Guangji; Guo, Xiaoyang; Li, Qingfeng
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
YOLO-RWY: Un nuevo modelo de detección de pistas para el aterrizaje autónomo basado en visión de vehículos aéreos no tripulados de ala fija
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Sistemas globales de navegación por satélite
Aterrizaje autónomo basado en visión
Vehículos aéreos no tripulados de ala fija
Detección de pistas
YOLO-RWY
Rendimiento en tiempo real
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En escenarios donde se niegan los sistemas de navegación por satélite global (GNSS) y los sistemas de navegación por radio, el aterrizaje autónomo basado en visión (VAL) para vehículos aéreos no tripulados (UAV) se vuelve esencial. La detección precisa y en tiempo real de la pista en VAL es vital para proporcionar una guía posicional y orientacional precisa. Sin embargo, la investigación existente enfrenta desafíos significativos, incluyendo una precisión insuficiente, un rendimiento en tiempo real inadecuado, una robustez deficiente y una alta susceptibilidad a perturbaciones. Para abordar estos desafíos, este documento presenta un nuevo marco de detección de pistas basado en visión, de una sola etapa, sin anclajes y desacoplado, denominado YOLO-RWY. Primero, se incorpora un módulo de aumento de datos mejorado (EDA) para realizar diversas aumentaciones, enriqueciendo la diversidad de imágenes e introduciendo perturbaciones que mejoran la generalización y la seguridad. En segundo lugar, se integra un módulo de atención de núcleo separable grande (LSKA) en la estructura de base para proporcionar un mecanismo de atención ligero con un amplio campo receptivo, mejorando la representación de características. En tercer lugar, la estructura del cuello se reorganiza como un módulo de red de pirámide de características bidireccional (BiFPN) con conexiones de salto y asignación de atención, lo que permite una fusión eficiente de características a múltiples escalas y entre etapas. Finalmente, la pérdida de regresión y el asignador de aprendizaje alineado a la tarea (TAL) se optimizan utilizando la intersección sobre la unión eficiente (EIoU) para mejorar la evaluación de localización, lo que resulta en una convergencia más rápida y precisa. Experimentos exhaustivos demuestran que YOLO-RWY logra puntuaciones AP50:95 de 0.760, 0.611 y 0.413 en conjuntos de prueba sintéticos, nominales reales y de borde real del conjunto de datos de detección de pistas de aproximación de aterrizaje (LARD), respectivamente. Los experimentos de implementación en un dispositivo de borde muestran que YOLO-RWY alcanza una velocidad de inferencia de 154.4 FPS bajo cuantización FP32 con un tamaño de imagen de 640. Los resultados indican que el modelo YOLO-RWY propuesto posee una fuerte generalización y capacidades en tiempo real, permitiendo una detección precisa de pistas en entornos visuales complejos y desafiantes, y proporcionando apoyo para los sistemas VAL a bordo de UAV de ala fija.
Descripción
En escenarios donde se niegan los sistemas de navegación por satélite global (GNSS) y los sistemas de navegación por radio, el aterrizaje autónomo basado en visión (VAL) para vehículos aéreos no tripulados (UAV) se vuelve esencial. La detección precisa y en tiempo real de la pista en VAL es vital para proporcionar una guía posicional y orientacional precisa. Sin embargo, la investigación existente enfrenta desafíos significativos, incluyendo una precisión insuficiente, un rendimiento en tiempo real inadecuado, una robustez deficiente y una alta susceptibilidad a perturbaciones. Para abordar estos desafíos, este documento presenta un nuevo marco de detección de pistas basado en visión, de una sola etapa, sin anclajes y desacoplado, denominado YOLO-RWY. Primero, se incorpora un módulo de aumento de datos mejorado (EDA) para realizar diversas aumentaciones, enriqueciendo la diversidad de imágenes e introduciendo perturbaciones que mejoran la generalización y la seguridad. En segundo lugar, se integra un módulo de atención de núcleo separable grande (LSKA) en la estructura de base para proporcionar un mecanismo de atención ligero con un amplio campo receptivo, mejorando la representación de características. En tercer lugar, la estructura del cuello se reorganiza como un módulo de red de pirámide de características bidireccional (BiFPN) con conexiones de salto y asignación de atención, lo que permite una fusión eficiente de características a múltiples escalas y entre etapas. Finalmente, la pérdida de regresión y el asignador de aprendizaje alineado a la tarea (TAL) se optimizan utilizando la intersección sobre la unión eficiente (EIoU) para mejorar la evaluación de localización, lo que resulta en una convergencia más rápida y precisa. Experimentos exhaustivos demuestran que YOLO-RWY logra puntuaciones AP50:95 de 0.760, 0.611 y 0.413 en conjuntos de prueba sintéticos, nominales reales y de borde real del conjunto de datos de detección de pistas de aproximación de aterrizaje (LARD), respectivamente. Los experimentos de implementación en un dispositivo de borde muestran que YOLO-RWY alcanza una velocidad de inferencia de 154.4 FPS bajo cuantización FP32 con un tamaño de imagen de 640. Los resultados indican que el modelo YOLO-RWY propuesto posee una fuerte generalización y capacidades en tiempo real, permitiendo una detección precisa de pistas en entornos visuales complejos y desafiantes, y proporcionando apoyo para los sistemas VAL a bordo de UAV de ala fija.