Algoritmo rápido de identificación y detección para aeronaves no tripuladas maniobrables basado en fusión de datos multimodales
Autores: Luan, Tian; Zhou, Shixiong; Zhang, Yicheng; Pan, Weijun
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Algoritmo rápido de identificación y detección para aeronaves no tripuladas maniobrables basado en fusión de datos multimodales
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Propone un marco de fusión de datos de múltiples fuentes para la detección de UAV con la arquitectura YOLO v11
la arquitectura de fusión RGB-IR
módulos de atención dinámica C3k2-DATB
BRSA
inyección de detalles semánticos
PCHead
pérdida de Distancia de Wasserstein
robustez de seguimiento
algoritmo BoT-SORT para una vigilancia de drones de alta precisión.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
Para abordar los desafíos críticos de capacidades de monitoreo insuficientes y sistemas de defensa vulnerables contra drones en aeropuertos regionales, este estudio propone un marco de fusión de datos de múltiples fuentes para una detección rápida de UAV. A partir de la arquitectura YOLO v11, desarrollamos un modelo mejorado que incorpora cuatro innovaciones clave: (1) Una arquitectura de fusión RGB-IR de doble vía que explota datos multimodales complementarios; (2) Módulos de atención dinámica C3k2-DATB para una extracción de características mejorada y percepción semántica; (3) Un mecanismo de atención de enrutamiento de dos niveles con consultas de agentes (BRSA) para una localización precisa de objetivos; (4) Un módulo de inyección de detalles semánticos (SDI) acoplado con cabezas de detección convolucional en forma de molino de viento (PCHead) y pérdida de distancia de Wasserstein para expandir campos receptivos y acelerar la convergencia. Los resultados experimentales demuestran un rendimiento superior con 99.3% mAP@50 (mejora del 17.4% sobre YOLOv11 base), manteniendo características ligeras (2.54M parámetros, 7.8 GFLOPS). Para implementación práctica, mejoramos aún más la robustez de seguimiento a través de un algoritmo BoT-SORT mejorado dentro de un marco interactivo de múltiples modelos, logrando 91.3% MOTA y 93.0% IDF1 en condiciones de poca luz. Esta solución integrada proporciona vigilancia de drones rentable y de alta precisión para aeropuertos con recursos limitados.
Descripción
Para abordar los desafíos críticos de capacidades de monitoreo insuficientes y sistemas de defensa vulnerables contra drones en aeropuertos regionales, este estudio propone un marco de fusión de datos de múltiples fuentes para una detección rápida de UAV. A partir de la arquitectura YOLO v11, desarrollamos un modelo mejorado que incorpora cuatro innovaciones clave: (1) Una arquitectura de fusión RGB-IR de doble vía que explota datos multimodales complementarios; (2) Módulos de atención dinámica C3k2-DATB para una extracción de características mejorada y percepción semántica; (3) Un mecanismo de atención de enrutamiento de dos niveles con consultas de agentes (BRSA) para una localización precisa de objetivos; (4) Un módulo de inyección de detalles semánticos (SDI) acoplado con cabezas de detección convolucional en forma de molino de viento (PCHead) y pérdida de distancia de Wasserstein para expandir campos receptivos y acelerar la convergencia. Los resultados experimentales demuestran un rendimiento superior con 99.3% mAP@50 (mejora del 17.4% sobre YOLOv11 base), manteniendo características ligeras (2.54M parámetros, 7.8 GFLOPS). Para implementación práctica, mejoramos aún más la robustez de seguimiento a través de un algoritmo BoT-SORT mejorado dentro de un marco interactivo de múltiples modelos, logrando 91.3% MOTA y 93.0% IDF1 en condiciones de poca luz. Esta solución integrada proporciona vigilancia de drones rentable y de alta precisión para aeropuertos con recursos limitados.