Hybrid-DETR: un modelo basado en módulos diferenciados para la detección de objetos en imágenes de teledetección
Autores: Yang, Mingji; Xu, Rongyu; Yang, Chunyu; Wu, Haibin; Wang, Aili
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Hybrid-DETR: un modelo basado en módulos diferenciados para la detección de objetos en imágenes de teledetección
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Propone
Modelo híbrido-detr en tiempo real de detección de extremo a extremo
Red principal hybridnet
Módulo de detección de objetos pequeños
Módulo eifi
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
Actualmente, los sistemas integrados de vehículos aéreos no tripulados (UAV) enfrentan desafíos significativos para equilibrar la precisión de detección y la eficiencia computacional al procesar imágenes de teledetección con fondos complejos, objetos pequeños y oclusiones. Este artículo propone el modelo Hybrid-DETR basado en un Transformador de Detección de extremo a extremo en tiempo real (RT-DETR), que cuenta con una nueva red de estructura base HybridNet que implementa una estructura híbrida diferenciada a través de módulos de Red de Agregación de Capas Eficientes Parciales RepConv (RCSPELAN) y módulos de Fusión de Transferencia de Calor (HTCF), equilibrando eficazmente la eficiencia de extracción de características y las capacidades de percepción global. Además, introducimos un Módulo de Detección de Objetos Pequeños (SODM) y un módulo EIFI para mejorar la capacidad de detección de objetos pequeños en escenarios complejos, mientras empleamos la función de pérdida Focaler-Shape-IoU para optimizar la regresión de cuadros delimitadores. Los resultados experimentales en el conjunto de datos VisDrone2019 demuestran que Hybrid-DETR logra puntajes de mAP50 y mAP50:95 de 52.2% y 33.3%, respectivamente, representando mejoras del 5.2% y 4.3% en comparación con RT-DETR-R18, al tiempo que reduce los parámetros del modelo en un 29.33%. La efectividad y robustez de nuestro método mejorado son validadas aún más en múltiples conjuntos de datos desafiantes, incluidos AI-TOD y HIT-UAV.
Descripción
Actualmente, los sistemas integrados de vehículos aéreos no tripulados (UAV) enfrentan desafíos significativos para equilibrar la precisión de detección y la eficiencia computacional al procesar imágenes de teledetección con fondos complejos, objetos pequeños y oclusiones. Este artículo propone el modelo Hybrid-DETR basado en un Transformador de Detección de extremo a extremo en tiempo real (RT-DETR), que cuenta con una nueva red de estructura base HybridNet que implementa una estructura híbrida diferenciada a través de módulos de Red de Agregación de Capas Eficientes Parciales RepConv (RCSPELAN) y módulos de Fusión de Transferencia de Calor (HTCF), equilibrando eficazmente la eficiencia de extracción de características y las capacidades de percepción global. Además, introducimos un Módulo de Detección de Objetos Pequeños (SODM) y un módulo EIFI para mejorar la capacidad de detección de objetos pequeños en escenarios complejos, mientras empleamos la función de pérdida Focaler-Shape-IoU para optimizar la regresión de cuadros delimitadores. Los resultados experimentales en el conjunto de datos VisDrone2019 demuestran que Hybrid-DETR logra puntajes de mAP50 y mAP50:95 de 52.2% y 33.3%, respectivamente, representando mejoras del 5.2% y 4.3% en comparación con RT-DETR-R18, al tiempo que reduce los parámetros del modelo en un 29.33%. La efectividad y robustez de nuestro método mejorado son validadas aún más en múltiples conjuntos de datos desafiantes, incluidos AI-TOD y HIT-UAV.