HSFANet: Red de Agregación de Características Sensibles a la Escala Jerárquica para la Detección de Objetos Pequeños en Imágenes Aéreas de UAV
Autores: Zhang, Hongxing; Ou, Zhonghong; Yao, Siyuan; Zhu, Yifan; Zhu, Yangfu; Li, Hailin; Wang, Shigeng; Guo, Yang; Song, Meina
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
HSFANet: Red de Agregación de Características Sensibles a la Escala Jerárquica para la Detección de Objetos Pequeños en Imágenes Aéreas de UAV
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Detección de objetos
Imágenes aéreas
Vehículo Aéreo No Tripulado
Objetos pequeños
Agregación de características
Sensible a la escala.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La detección de objetos pequeños en imágenes aéreas, particularmente desde plataformas de Vehículos Aéreos No Tripulados (VANT), sigue siendo un desafío significativo debido a la resolución limitada de los objetos, escenas densas e interferencias de fondo. Sin embargo, los detectores de objetos pequeños existentes a menudo pasan por alto el uso completo de características jerárquicas e inevitablemente introducen interferencias de ruido debido a las operaciones de sobremuestreo jerárquico, y las métricas de pérdida comúnmente utilizadas carecen de sensibilidad a la información de escala; estos dos problemas conducen conjuntamente a un deterioro del rendimiento. Para abordar estos problemas, proponemos la Red de Agregación de Características Sensibles a la Escala Jerárquica (HSFANet), un marco novedoso que realiza una interacción robusta de características entre capas para percibir la información de posición de los objetos pequeños en pirámides de características jerárquicas y obliga al modelo a equilibrar las cabezas de predicción multiescala para una localización precisa de instancias. HSFANet introduce un módulo de Agregación de Posición Dinámica (DPA) para mejorar explícitamente el área del objeto en capas tanto superficiales como profundas, que es capaz de explotar la representación saliente complementaria de los objetos pequeños. Además, se propone una Pérdida Sensible a la Escala (SSL) eficiente para equilibrar las salidas de detección de objetos pequeños en cabezas de predicción jerárquicas, mejorando así de manera efectiva el rendimiento de la detección de objetos pequeños. Experimentos extensivos en dos desafiantes benchmarks de VANT, VisDrone y UAVDT, demuestran que HSFANet logra resultados de vanguardia (SOTA), con una mejora del 1.3% en la precisión promedio general (AP) y una notable mejora del 2.2% en AP para objetos pequeños en VisDrone. En UAVDT, HSFANet supera a métodos anteriores en un 0.3% en AP general y un 16.7% en AP de objetos pequeños. Estos resultados destacan la efectividad de HSFANet en mejorar el rendimiento de la detección de objetos pequeños en imágenes aéreas complejas, lo que lo hace bien adecuado para aplicaciones prácticas basadas en VANT.
Descripción
La detección de objetos pequeños en imágenes aéreas, particularmente desde plataformas de Vehículos Aéreos No Tripulados (VANT), sigue siendo un desafío significativo debido a la resolución limitada de los objetos, escenas densas e interferencias de fondo. Sin embargo, los detectores de objetos pequeños existentes a menudo pasan por alto el uso completo de características jerárquicas e inevitablemente introducen interferencias de ruido debido a las operaciones de sobremuestreo jerárquico, y las métricas de pérdida comúnmente utilizadas carecen de sensibilidad a la información de escala; estos dos problemas conducen conjuntamente a un deterioro del rendimiento. Para abordar estos problemas, proponemos la Red de Agregación de Características Sensibles a la Escala Jerárquica (HSFANet), un marco novedoso que realiza una interacción robusta de características entre capas para percibir la información de posición de los objetos pequeños en pirámides de características jerárquicas y obliga al modelo a equilibrar las cabezas de predicción multiescala para una localización precisa de instancias. HSFANet introduce un módulo de Agregación de Posición Dinámica (DPA) para mejorar explícitamente el área del objeto en capas tanto superficiales como profundas, que es capaz de explotar la representación saliente complementaria de los objetos pequeños. Además, se propone una Pérdida Sensible a la Escala (SSL) eficiente para equilibrar las salidas de detección de objetos pequeños en cabezas de predicción jerárquicas, mejorando así de manera efectiva el rendimiento de la detección de objetos pequeños. Experimentos extensivos en dos desafiantes benchmarks de VANT, VisDrone y UAVDT, demuestran que HSFANet logra resultados de vanguardia (SOTA), con una mejora del 1.3% en la precisión promedio general (AP) y una notable mejora del 2.2% en AP para objetos pequeños en VisDrone. En UAVDT, HSFANet supera a métodos anteriores en un 0.3% en AP general y un 16.7% en AP de objetos pequeños. Estos resultados destacan la efectividad de HSFANet en mejorar el rendimiento de la detección de objetos pequeños en imágenes aéreas complejas, lo que lo hace bien adecuado para aplicaciones prácticas basadas en VANT.