ESO-DETR: Un modelo de transformador de detección en tiempo real mejorado para una detección mejorada de objetos pequeños en imágenes de UAV
Autores: Liu, Yingfan; He, Miao; Hui, Bin
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
ESO-DETR: Un modelo de transformador de detección en tiempo real mejorado para una detección mejorada de objetos pequeños en imágenes de UAV
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Detección de objetos
Drones
Algoritmos
Modelo transformer
Detección de objetos pequeños
Mecanismos de atención
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La detección de objetos es una capacidad fundamental que permite a los drones realizar diversas tareas. Sin embargo, lograr un equilibrio adecuado entre rendimiento, eficiencia y diseño ligero sigue siendo un desafío significativo para los algoritmos actuales. Para abordar este problema, proponemos un modelo mejorado de detección de objetos pequeños llamado ESO-DETR. Primero, presentamos un bloque de respaldo de atención de cabeza única con compuerta, conocido como el bloque GSHA, que mejora la extracción de detalles locales. Además, ESO-DETR utiliza el mecanismo de atención autoatenta multiescala y multicanal (MMSA) para gestionar de manera eficiente características complejas dentro de su red de respaldo. También introducimos una nueva y eficiente red de pirámide de fusión de características para la detección mejorada de objetos pequeños, denominada ESO-FPN. Esta red integra grandes núcleos convolucionales con mecanismos de atención de doble dominio. Por último, introducimos la pérdida EMASlideVariFocal (pérdida ESVF), que ajusta dinámicamente los pesos para mejorar el enfoque del modelo en muestras más desafiantes. En comparación con el modelo base, ESO-DETR demuestra mejoras del 3.9% y 4.0% en la métrica mAP50 en los conjuntos de datos VisDrone y HIT-UAV, respectivamente, mientras que también reduce los parámetros en un 25%. Estos resultados destacan la capacidad de ESO-DETR para mejorar la precisión de detección mientras mantiene una estructura ligera y eficiente.
Descripción
La detección de objetos es una capacidad fundamental que permite a los drones realizar diversas tareas. Sin embargo, lograr un equilibrio adecuado entre rendimiento, eficiencia y diseño ligero sigue siendo un desafío significativo para los algoritmos actuales. Para abordar este problema, proponemos un modelo mejorado de detección de objetos pequeños llamado ESO-DETR. Primero, presentamos un bloque de respaldo de atención de cabeza única con compuerta, conocido como el bloque GSHA, que mejora la extracción de detalles locales. Además, ESO-DETR utiliza el mecanismo de atención autoatenta multiescala y multicanal (MMSA) para gestionar de manera eficiente características complejas dentro de su red de respaldo. También introducimos una nueva y eficiente red de pirámide de fusión de características para la detección mejorada de objetos pequeños, denominada ESO-FPN. Esta red integra grandes núcleos convolucionales con mecanismos de atención de doble dominio. Por último, introducimos la pérdida EMASlideVariFocal (pérdida ESVF), que ajusta dinámicamente los pesos para mejorar el enfoque del modelo en muestras más desafiantes. En comparación con el modelo base, ESO-DETR demuestra mejoras del 3.9% y 4.0% en la métrica mAP50 en los conjuntos de datos VisDrone y HIT-UAV, respectivamente, mientras que también reduce los parámetros en un 25%. Estos resultados destacan la capacidad de ESO-DETR para mejorar la precisión de detección mientras mantiene una estructura ligera y eficiente.