Método de Detección de Objetivos Pequeños de UAV Basado en un Espina Dorsal de Fusión Multi-escala Mejorada por Frecuencia
Autores: Zhong, Yi; Zhao, Di; Han, Yi; Wang, Zhou
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Método de Detección de Objetivos Pequeños de UAV Basado en un Espina Dorsal de Fusión Multi-escala Mejorada por Frecuencia
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Detección de objetos
Perspectivas de UAV
Detección en tiempo real mejorada por frecuencia
Fusión a múltiples escalas
Forma-NWD
Precisión de regresión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
A pesar de la adopción generalizada de la detección de objetos basada en UAV, las arquitecturas tradicionales de YOLO están limitadas por su dependencia de NMS, lo que complica el despliegue en dispositivos de borde debido al soporte limitado en las plataformas de aceleración de hardware. Si bien los modelos de extremo a extremo como RT-DETR eliminan este cuello de botella, sufren una degradación severa de características para objetivos pequeños causada por el conflicto inherente entre la submuestreo profundo y la preservación de detalles. Para cerrar esta brecha, proponemos un marco de Detección en Tiempo Real Mejorado por Frecuencia diseñado específicamente para perspectivas de UAV. A diferencia de los esqueletos estándar, nuestro diseño incorpora un módulo de Fusión Multi-escala Mejorada por Frecuencia, que transforma características en el dominio de la frecuencia para amplificar explícitamente los componentes de alta frecuencia esenciales para la localización de objetos pequeños. Además, se introduce un módulo de Interacción Multi-Núcleo Agrupada para capturar dinámicamente información contextual multi-escala. Además, integramos Shape-NWD en el cálculo de la pérdida al introducir coeficientes de peso de forma y factores de correlación de escala, dirigiendo el enfoque hacia los atributos intrínsecos de las cajas delimitadoras para mejorar la precisión de regresión para objetivos diminutos. Los resultados experimentales en el conjunto de datos VisDrone demuestran que nuestro método mejora la Precisión Promedio en un 0.9% y AP50 en un 1.1% en comparación con la línea base, con ganancias consistentes observadas en el conjunto de datos UAVVaste.
Descripción
A pesar de la adopción generalizada de la detección de objetos basada en UAV, las arquitecturas tradicionales de YOLO están limitadas por su dependencia de NMS, lo que complica el despliegue en dispositivos de borde debido al soporte limitado en las plataformas de aceleración de hardware. Si bien los modelos de extremo a extremo como RT-DETR eliminan este cuello de botella, sufren una degradación severa de características para objetivos pequeños causada por el conflicto inherente entre la submuestreo profundo y la preservación de detalles. Para cerrar esta brecha, proponemos un marco de Detección en Tiempo Real Mejorado por Frecuencia diseñado específicamente para perspectivas de UAV. A diferencia de los esqueletos estándar, nuestro diseño incorpora un módulo de Fusión Multi-escala Mejorada por Frecuencia, que transforma características en el dominio de la frecuencia para amplificar explícitamente los componentes de alta frecuencia esenciales para la localización de objetos pequeños. Además, se introduce un módulo de Interacción Multi-Núcleo Agrupada para capturar dinámicamente información contextual multi-escala. Además, integramos Shape-NWD en el cálculo de la pérdida al introducir coeficientes de peso de forma y factores de correlación de escala, dirigiendo el enfoque hacia los atributos intrínsecos de las cajas delimitadoras para mejorar la precisión de regresión para objetivos diminutos. Los resultados experimentales en el conjunto de datos VisDrone demuestran que nuestro método mejora la Precisión Promedio en un 0.9% y AP50 en un 1.1% en comparación con la línea base, con ganancias consistentes observadas en el conjunto de datos UAVVaste.