MSUD-YOLO: Un nuevo modelo de detección de objetos pequeños a múltiples escalas para imágenes aéreas de UAV
Autores: Zhao, Xiaofeng; Zhang, Hui; Zhang, Wenwen; Ma, Junyi; Li, Chenxiao; Ding, Yao; Zhang, Zhili
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
MSUD-YOLO: Un nuevo modelo de detección de objetos pequeños a múltiples escalas para imágenes aéreas de UAV
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Objetos
Imágenes aéreas de UAV
Objetos pequeños
Fusión de características multiescala
MSUD-YOLO
YOLOv10s
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Debido a que los objetos en las imágenes aéreas de UAV a menudo presentan características de múltiples escalas, objetos pequeños, fondos complejos, etc., el rendimiento de la detección de objetos utilizando modelos actuales no es satisfactorio. Para abordar los problemas mencionados, este artículo diseña un modelo de detección de objetos pequeños multiescala para imágenes aéreas de UAV, denominado MSUD-YOLO, basado en YOLOv10s. Primero, el modelo utiliza un modo de fusión de secuencia de escala de atención para lograr una fusión de características multiescala más eficiente. Mientras tanto, se incorpora una cabeza de predicción pequeña para hacer que el modelo se enfoque en las características de bajo nivel, mejorando así su capacidad para detectar objetos pequeños. En segundo lugar, se ha diseñado un nuevo módulo de extracción de características llamado CFormerCGLU, que mejora la capacidad de extracción de características de una manera más ligera. Además, el modelo utiliza convolución ligera en lugar de convolución estándar para reducir el cálculo del modelo. Finalmente, se utiliza la función de pérdida WIoU v3 para hacer que el modelo se enfoque más en ejemplos de baja calidad, mejorando así la capacidad de localización de objetos del modelo. Los resultados experimentales en el conjunto de datos VisDrone2019 muestran que MSUD-YOLO mejora el mAP50 en un 8.5% en comparación con YOLOv10s. Al mismo tiempo, el modelo general reduce los parámetros en un 6.3%, verificando la efectividad del modelo para la detección de objetos en imágenes aéreas de UAV en entornos complejos. Además, en comparación con múltiples algoritmos de detección de objetos de UAV más recientes, nuestro MSUD-YOLO diseñado ofrece una mayor precisión de detección y un menor costo computacional; por ejemplo, el mAP50 alcanza el 43.4%, pero los parámetros son solo 6.766 M.
Descripción
Debido a que los objetos en las imágenes aéreas de UAV a menudo presentan características de múltiples escalas, objetos pequeños, fondos complejos, etc., el rendimiento de la detección de objetos utilizando modelos actuales no es satisfactorio. Para abordar los problemas mencionados, este artículo diseña un modelo de detección de objetos pequeños multiescala para imágenes aéreas de UAV, denominado MSUD-YOLO, basado en YOLOv10s. Primero, el modelo utiliza un modo de fusión de secuencia de escala de atención para lograr una fusión de características multiescala más eficiente. Mientras tanto, se incorpora una cabeza de predicción pequeña para hacer que el modelo se enfoque en las características de bajo nivel, mejorando así su capacidad para detectar objetos pequeños. En segundo lugar, se ha diseñado un nuevo módulo de extracción de características llamado CFormerCGLU, que mejora la capacidad de extracción de características de una manera más ligera. Además, el modelo utiliza convolución ligera en lugar de convolución estándar para reducir el cálculo del modelo. Finalmente, se utiliza la función de pérdida WIoU v3 para hacer que el modelo se enfoque más en ejemplos de baja calidad, mejorando así la capacidad de localización de objetos del modelo. Los resultados experimentales en el conjunto de datos VisDrone2019 muestran que MSUD-YOLO mejora el mAP50 en un 8.5% en comparación con YOLOv10s. Al mismo tiempo, el modelo general reduce los parámetros en un 6.3%, verificando la efectividad del modelo para la detección de objetos en imágenes aéreas de UAV en entornos complejos. Además, en comparación con múltiples algoritmos de detección de objetos de UAV más recientes, nuestro MSUD-YOLO diseñado ofrece una mayor precisión de detección y un menor costo computacional; por ejemplo, el mAP50 alcanza el 43.4%, pero los parámetros son solo 6.766 M.