AUP-DETR: Un marco fundamental de detección de objetos de UAV para habilitar la economía de baja altitud
Autores: Xu, Jiajing; Liu, Xiaozhang; Li, Xiulai; Hu, Yuanyan
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
AUP-DETR: Un marco fundamental de detección de objetos de UAV para habilitar la economía de baja altitud
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Percepción autónoma
Modelos de detección de objetos
UAVs
AUP-DETR
Módulo Fusion-SHC
Detección Aérea Costera Urbana
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El ascenso de la economía de baja altitud subraya la necesidad crítica de percepción autónoma en Vehículos Aéreos No Tripulados (VANT), particularmente en entornos complejos como los puertos urbanos. Sin embargo, los modelos de detección de objetos existentes a menudo tienen un rendimiento deficiente al tratar con escenas mixtas de tierra y mar, variaciones extremas de escala y distribuciones densas de objetos desde la perspectiva aérea de un VANT. Para abordar este desafío, proponemos AUP-DETR, un nuevo marco de detección de objetos de extremo a extremo para VANT. Este marco, construido sobre una arquitectura DETR eficiente, presenta el innovador módulo Fusión con Núcleo Híbrido Simplificado (Fusion-SHC). Este módulo fusiona eficazmente los detalles espaciales de bajo nivel con la semántica de alto nivel para fortalecer la representación de pequeños objetos aéreos. Además, un módulo de Fusión de Contexto Espacial Sinérgico (SSCF) integra de manera adaptativa características multiescala para generar representaciones ricas y unificadas para la cabeza de detección. Además, el propuesto Transformador de Agente Espacial (SAT) modela eficientemente el contexto global y las dependencias de largo alcance para distinguir objetos heterogéneos en escenas complejas. Para avanzar en la investigación relacionada, hemos construido el conjunto de datos de Detección Aérea Costera Urbana (UCA-Det), que está diseñado específicamente para entornos de puertos urbanos. Experimentos extensos en nuestro conjunto de datos UCA-Det muestran que AUP-DETR supera a la serie YOLO y otros modelos avanzados basados en DETR. Nuestro modelo logra un mAP50 del 69.68%, lo que representa una mejora del 4.41% sobre la línea base. Además, los experimentos en el conjunto de datos público VisDrone validan su excelente capacidad de generalización y eficiencia. Esta investigación ofrece una solución robusta y establece un nuevo conjunto de datos para la percepción precisa de VANT en escenarios de economía de baja altitud.
Descripción
El ascenso de la economía de baja altitud subraya la necesidad crítica de percepción autónoma en Vehículos Aéreos No Tripulados (VANT), particularmente en entornos complejos como los puertos urbanos. Sin embargo, los modelos de detección de objetos existentes a menudo tienen un rendimiento deficiente al tratar con escenas mixtas de tierra y mar, variaciones extremas de escala y distribuciones densas de objetos desde la perspectiva aérea de un VANT. Para abordar este desafío, proponemos AUP-DETR, un nuevo marco de detección de objetos de extremo a extremo para VANT. Este marco, construido sobre una arquitectura DETR eficiente, presenta el innovador módulo Fusión con Núcleo Híbrido Simplificado (Fusion-SHC). Este módulo fusiona eficazmente los detalles espaciales de bajo nivel con la semántica de alto nivel para fortalecer la representación de pequeños objetos aéreos. Además, un módulo de Fusión de Contexto Espacial Sinérgico (SSCF) integra de manera adaptativa características multiescala para generar representaciones ricas y unificadas para la cabeza de detección. Además, el propuesto Transformador de Agente Espacial (SAT) modela eficientemente el contexto global y las dependencias de largo alcance para distinguir objetos heterogéneos en escenas complejas. Para avanzar en la investigación relacionada, hemos construido el conjunto de datos de Detección Aérea Costera Urbana (UCA-Det), que está diseñado específicamente para entornos de puertos urbanos. Experimentos extensos en nuestro conjunto de datos UCA-Det muestran que AUP-DETR supera a la serie YOLO y otros modelos avanzados basados en DETR. Nuestro modelo logra un mAP50 del 69.68%, lo que representa una mejora del 4.41% sobre la línea base. Además, los experimentos en el conjunto de datos público VisDrone validan su excelente capacidad de generalización y eficiencia. Esta investigación ofrece una solución robusta y establece un nuevo conjunto de datos para la percepción precisa de VANT en escenarios de economía de baja altitud.