DBM-YOLO: Un modelo de doble rama con compartición de características para la detección de objetos de UAV en entornos de baja iluminación
Autores: Liu, Liwen; Li, Huilin; Fu, Gui; Zhou, Bo; Wang, You; Fan, Rong
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
DBM-YOLO: Un modelo de doble rama con compartición de características para la detección de objetos de UAV en entornos de baja iluminación
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Resolver
precisión de detección degradada
vehículo aéreo no tripulado
entornos de baja iluminación
modelo de detección de objetos
representación de características
atención de canal basada en agrupamiento dinámico
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Para resolver el problema de la degradación de la precisión de detección en la detección de objetos de vehículos aéreos no tripulados en entornos de baja iluminación, este documento presenta un modelo de detección de objetos paralelo. Primero, se establece una arquitectura de doble rama al integrar paralelamente una red de mejora de iluminación de Estimación de Curva Profunda Sin Referencia (Zero-DCE) con una red de detección de objetos basada en You Only Look Once (YOLOv11n), lo que permite un entrenamiento colaborativo de características y actualizaciones en tiempo real. A través de un mecanismo de compartición de características, las dos ramas se optimizan conjuntamente durante el entrenamiento, mejorando así la capacidad de generalización del modelo en entornos de baja iluminación. Además, para mejorar aún más la precisión de detección, se introduce un módulo de Atención Sinérgica de Agrupamiento Dinámico (DPSA) en la columna vertebral de YOLOv11n. Al integrar la atención de canal basada en agrupamiento dinámico con la atención espacial, este módulo mejora la representación de características, mejora el rendimiento en entornos complejos y aumenta la adaptabilidad a objetivos de múltiples escalas. Además, se añade un módulo de Modulación de Características Espacialmente Adaptativa de Alta y Baja Frecuencia (HLSAFM) al cuello de la red de detección. A través de la refinación de características de alta y baja frecuencia, el procesamiento de características segmentadas y la modulación dinámica, la red puede capturar información de características más rica, fortaleciendo así la representación de características y la capacidad discriminativa. Experimentos extensivos en los conjuntos de datos VisDrone (Noche) y DroneVehicle (Noche) demuestran un rendimiento superior en comparación con múltiples métodos existentes en tareas de detección de objetos en baja iluminación. En comparación con el modelo original YOLOv11n, el mAP50 del modelo propuesto aumenta en un 6.0% y un 1.0%, y el mAP50:95 aumenta en un 3.1% y un 0.8%, respectivamente. Estos resultados confirman la capacidad de detección mejorada lograda por nuestro método en desafiantes escenarios de vehículos aéreos no tripulados (UAV) en condiciones de baja iluminación.
Descripción
Para resolver el problema de la degradación de la precisión de detección en la detección de objetos de vehículos aéreos no tripulados en entornos de baja iluminación, este documento presenta un modelo de detección de objetos paralelo. Primero, se establece una arquitectura de doble rama al integrar paralelamente una red de mejora de iluminación de Estimación de Curva Profunda Sin Referencia (Zero-DCE) con una red de detección de objetos basada en You Only Look Once (YOLOv11n), lo que permite un entrenamiento colaborativo de características y actualizaciones en tiempo real. A través de un mecanismo de compartición de características, las dos ramas se optimizan conjuntamente durante el entrenamiento, mejorando así la capacidad de generalización del modelo en entornos de baja iluminación. Además, para mejorar aún más la precisión de detección, se introduce un módulo de Atención Sinérgica de Agrupamiento Dinámico (DPSA) en la columna vertebral de YOLOv11n. Al integrar la atención de canal basada en agrupamiento dinámico con la atención espacial, este módulo mejora la representación de características, mejora el rendimiento en entornos complejos y aumenta la adaptabilidad a objetivos de múltiples escalas. Además, se añade un módulo de Modulación de Características Espacialmente Adaptativa de Alta y Baja Frecuencia (HLSAFM) al cuello de la red de detección. A través de la refinación de características de alta y baja frecuencia, el procesamiento de características segmentadas y la modulación dinámica, la red puede capturar información de características más rica, fortaleciendo así la representación de características y la capacidad discriminativa. Experimentos extensivos en los conjuntos de datos VisDrone (Noche) y DroneVehicle (Noche) demuestran un rendimiento superior en comparación con múltiples métodos existentes en tareas de detección de objetos en baja iluminación. En comparación con el modelo original YOLOv11n, el mAP50 del modelo propuesto aumenta en un 6.0% y un 1.0%, y el mAP50:95 aumenta en un 3.1% y un 0.8%, respectivamente. Estos resultados confirman la capacidad de detección mejorada lograda por nuestro método en desafiantes escenarios de vehículos aéreos no tripulados (UAV) en condiciones de baja iluminación.