logo móvil
Contáctanos

MSUD-YOLO: Un nuevo modelo de detección de objetos pequeños a múltiples escalas para imágenes aéreas de UAV

Autores: Zhao, Xiaofeng; Zhang, Hui; Zhang, Wenwen; Ma, Junyi; Li, Chenxiao; Ding, Yao; Zhang, Zhili

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

MSUD-YOLO: Un nuevo modelo de detección de objetos pequeños a múltiples escalas para imágenes aéreas de UAV


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Objetos
Imágenes aéreas de UAV
Objetos pequeños
Fusión de características multiescala
MSUD-YOLO
YOLOv10s

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Debido a que los objetos en las imágenes aéreas de UAV a menudo presentan características de múltiples escalas, objetos pequeños, fondos complejos, etc., el rendimiento de la detección de objetos utilizando modelos actuales no es satisfactorio. Para abordar los problemas mencionados, este artículo diseña un modelo de detección de objetos pequeños multiescala para imágenes aéreas de UAV, denominado MSUD-YOLO, basado en YOLOv10s. Primero, el modelo utiliza un modo de fusión de secuencia de escala de atención para lograr una fusión de características multiescala más eficiente. Mientras tanto, se incorpora una cabeza de predicción pequeña para hacer que el modelo se enfoque en las características de bajo nivel, mejorando así su capacidad para detectar objetos pequeños. En segundo lugar, se ha diseñado un nuevo módulo de extracción de características llamado CFormerCGLU, que mejora la capacidad de extracción de características de una manera más ligera. Además, el modelo utiliza convolución ligera en lugar de convolución estándar para reducir el cálculo del modelo. Finalmente, se utiliza la función de pérdida WIoU v3 para hacer que el modelo se enfoque más en ejemplos de baja calidad, mejorando así la capacidad de localización de objetos del modelo. Los resultados experimentales en el conjunto de datos VisDrone2019 muestran que MSUD-YOLO mejora el mAP50 en un 8.5% en comparación con YOLOv10s. Al mismo tiempo, el modelo general reduce los parámetros en un 6.3%, verificando la efectividad del modelo para la detección de objetos en imágenes aéreas de UAV en entornos complejos. Además, en comparación con múltiples algoritmos de detección de objetos de UAV más recientes, nuestro MSUD-YOLO diseñado ofrece una mayor precisión de detección y un menor costo computacional; por ejemplo, el mAP50 alcanza el 43.4%, pero los parámetros son solo 6.766 M.

Otros recursos que podrían interesarte

Temas Virtualpro