MS-YOLOv7: YOLOv7 basado en múltiples escalas para la detección de objetos en fotografía aérea de UAV
Autores: Zhao, LiangLiang; Zhu, MinLing
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
MS-YOLOv7: YOLOv7 basado en múltiples escalas para la detección de objetos en fotografía aérea de UAV
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Modelo de detección de objetos propuesto
Imagen aérea de UAV
Arquitectura de red
Aumento de rendimiento
Precisión de detección
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Se propuso un modelo de detección de objetos en imágenes aéreas de UAV a múltiples escalas, MS-YOLOv7, basado en YOLOv7, para abordar los problemas de la gran cantidad de objetos y la alta proporción de objetos pequeños que comúnmente existen en las imágenes aéreas de Vehículos Aéreos No Tripulados (UAV). La nueva red se desarrolla con una cabeza de detección múltiple y un módulo de atención convolucional CBAM para extraer características a diferentes escalas. Para resolver el problema de la detección de objetos de alta densidad, se propone una arquitectura de red YOLOv7 combinada con las unidades Swin Transformer, y se incorpora un nuevo módulo de agrupamiento piramidal, SPPFS, en la red. Finalmente, incorporamos el SoftNMS y la función de activación Mish para mejorar la capacidad de la red para identificar objetos superpuestos y en oclusión. Varios experimentos en el conjunto de datos de código abierto VisDrone2019 revelan que nuestro nuevo modelo aporta un aumento significativo en el rendimiento en comparación con otros modelos de última generación (SOTA). En comparación con el algoritmo de detección de objetos YOLOv7 de la red base, el mAP0.5 de MS-YOLOv7 aumentó en un 6.0%, y el mAP0.95 aumentó en un 4.9%. Los experimentos de ablación muestran que los módulos diseñados pueden mejorar la precisión de detección y mostrar visualmente el efecto de detección en diferentes escenarios. Este experimento demuestra la aplicabilidad de MS-YOLOv7 para la detección de objetos en fotografías aéreas de UAV.
Descripción
Se propuso un modelo de detección de objetos en imágenes aéreas de UAV a múltiples escalas, MS-YOLOv7, basado en YOLOv7, para abordar los problemas de la gran cantidad de objetos y la alta proporción de objetos pequeños que comúnmente existen en las imágenes aéreas de Vehículos Aéreos No Tripulados (UAV). La nueva red se desarrolla con una cabeza de detección múltiple y un módulo de atención convolucional CBAM para extraer características a diferentes escalas. Para resolver el problema de la detección de objetos de alta densidad, se propone una arquitectura de red YOLOv7 combinada con las unidades Swin Transformer, y se incorpora un nuevo módulo de agrupamiento piramidal, SPPFS, en la red. Finalmente, incorporamos el SoftNMS y la función de activación Mish para mejorar la capacidad de la red para identificar objetos superpuestos y en oclusión. Varios experimentos en el conjunto de datos de código abierto VisDrone2019 revelan que nuestro nuevo modelo aporta un aumento significativo en el rendimiento en comparación con otros modelos de última generación (SOTA). En comparación con el algoritmo de detección de objetos YOLOv7 de la red base, el mAP0.5 de MS-YOLOv7 aumentó en un 6.0%, y el mAP0.95 aumentó en un 4.9%. Los experimentos de ablación muestran que los módulos diseñados pueden mejorar la precisión de detección y mostrar visualmente el efecto de detección en diferentes escenarios. Este experimento demuestra la aplicabilidad de MS-YOLOv7 para la detección de objetos en fotografías aéreas de UAV.