Detección de Nidos de Aves en Torres de Transmisión en Imágenes Aéreas Basada en YOLOv5s Mejorado
Autores: Han, Gujing; Wang, Ruijie; Yuan, Qiwei; Li, Saidian; Zhao, Liu; He, Min; Yang, Shiqi; Qin, Liang
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Detección de Nidos de Aves en Torres de Transmisión en Imágenes Aéreas Basada en YOLOv5s Mejorado
Categoría
Tecnología de Equipos y Accesorios
Subcategoría
Diseño de equipos y herramientas
Palabras clave
Modelo de detección de precisión mejorada yolov5s
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
Para mejorar aún más la precisión de la detección de modelos de nidos de aves en torres de transmisión en imágenes aéreas sin aumentar significativamente el tamaño del modelo y hacer que la detección sea más adecuada para aplicaciones de borde, se mejora en este documento el modelo ligero YOLOv5s. Primero, se reconfigura la red de backbone original utilizando el módulo OSA (One-Shot Aggregation) en el VOVNet y se incorpora el CBAM (Convolution Block Attention Module) en la red de extracción de características, lo que mejora la precisión del modelo para el reconocimiento de pequeños objetivos. Luego, se reducen las tasas atrous y el número de convoluciones atrous del módulo ASPP (Atrous Spatial Pyramid Pooling) para disminuir efectivamente los parámetros del ASPP. El ASPP se incorpora a la red de fusión de características para mejorar la detección de los objetivos en fondos complejos, mejorando la precisión del modelo. Los experimentos muestran que el mAP (mean-Average Precision) del modelo YOLOv5s mejorado por fusión aumenta del 91.84% al 95.18%, con solo un aumento del 27.4% en el tamaño del modelo. Finalmente, el modelo YOLOv5s mejorado se despliega en el Jeston Xavier NX, resultando en un modelo que funciona bien y tiene un aumento sustancial en precisión y una velocidad de 10.2 FPS, que es solo 0.7 FPS más lento que el modelo original YOLOv5s.
Descripción
Para mejorar aún más la precisión de la detección de modelos de nidos de aves en torres de transmisión en imágenes aéreas sin aumentar significativamente el tamaño del modelo y hacer que la detección sea más adecuada para aplicaciones de borde, se mejora en este documento el modelo ligero YOLOv5s. Primero, se reconfigura la red de backbone original utilizando el módulo OSA (One-Shot Aggregation) en el VOVNet y se incorpora el CBAM (Convolution Block Attention Module) en la red de extracción de características, lo que mejora la precisión del modelo para el reconocimiento de pequeños objetivos. Luego, se reducen las tasas atrous y el número de convoluciones atrous del módulo ASPP (Atrous Spatial Pyramid Pooling) para disminuir efectivamente los parámetros del ASPP. El ASPP se incorpora a la red de fusión de características para mejorar la detección de los objetivos en fondos complejos, mejorando la precisión del modelo. Los experimentos muestran que el mAP (mean-Average Precision) del modelo YOLOv5s mejorado por fusión aumenta del 91.84% al 95.18%, con solo un aumento del 27.4% en el tamaño del modelo. Finalmente, el modelo YOLOv5s mejorado se despliega en el Jeston Xavier NX, resultando en un modelo que funciona bien y tiene un aumento sustancial en precisión y una velocidad de 10.2 FPS, que es solo 0.7 FPS más lento que el modelo original YOLOv5s.