Investigación y experimentación en un modelo de identificación de hierba gallinera basado en YOLOv5s mejorado
Autores: Yu, Hong; Zhao, Jie; Xi, Xiaobo; Li, Yongbo; Zhao, Ying
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Investigación y experimentación en un modelo de identificación de hierba gallinera basado en YOLOv5s mejorado
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Agronomía y Ciencia de los Cultivos
Palabras clave
Redes convolucionales profundas de múltiples capas
Reconocimiento de malas hierbas
Parámetros del modelo
Velocidad de detección
YOLOv5s
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
Actualmente, las redes convolucionales profundas de múltiples capas se utilizan principalmente para el reconocimiento de malezas en el campo para extraer e identificar características objetivo. Sin embargo, en escenarios de aplicación práctica, aún enfrentan desafíos como la precisión de reconocimiento insuficiente, un gran número de parámetros del modelo y una velocidad de detección lenta. En respuesta a los problemas mencionados, se propuso un modelo de identificación de malezas basado en YOLOv5s mejorado utilizando el diente de león como objeto de identificación. Primero, se agregaron el Módulo Squeeze-and-Excitation (SE) y el Módulo de Atención de Bloque Convolucional (CBAM) a la red de extracción de características del modelo para mejorar la precisión de reconocimiento del modelo; en segundo lugar, se introdujo la red de fusión de características livianas Ghost convolution para identificar de manera efectiva el volumen, la cantidad de parámetros y la cantidad de cálculos del modelo, y hacer que el modelo sea liviano; finalmente, reemplazamos la función de pérdida en la caja delimitadora objetivo original con la función de pérdida Efficient Intersection over Union (EloU) para mejorar aún más el rendimiento de detección del modelo YOLOv5s mejorado. Después de las pruebas, la precisión del modelo YOLOv5s mejorado fue del 96.80%, la tasa de recuperación fue del 94.00%, la precisión promedio fue del 93.20% y la velocidad de cuadros fue de 14.01 fps, lo que representó mejoras del 6.6%, 4.4%, 1.0% y 6.1%, respectivamente, en comparación con el modelo YOLOv5s original. El volumen del modelo fue de 9.6 MB, la cantidad de cálculos fue de 13.6 GB y la cantidad de parámetros fue de 5.9 MB, lo que disminuyó en un 29.4%, 14.5% y 13.2% en comparación con el modelo YOLOv5s original, respectivamente. Este modelo puede distinguir eficazmente el diente de león entre los cultivos. Esta investigación puede proporcionar apoyo teórico y técnico para la identificación eficiente de malezas en entornos de campo complejos.
Descripción
Actualmente, las redes convolucionales profundas de múltiples capas se utilizan principalmente para el reconocimiento de malezas en el campo para extraer e identificar características objetivo. Sin embargo, en escenarios de aplicación práctica, aún enfrentan desafíos como la precisión de reconocimiento insuficiente, un gran número de parámetros del modelo y una velocidad de detección lenta. En respuesta a los problemas mencionados, se propuso un modelo de identificación de malezas basado en YOLOv5s mejorado utilizando el diente de león como objeto de identificación. Primero, se agregaron el Módulo Squeeze-and-Excitation (SE) y el Módulo de Atención de Bloque Convolucional (CBAM) a la red de extracción de características del modelo para mejorar la precisión de reconocimiento del modelo; en segundo lugar, se introdujo la red de fusión de características livianas Ghost convolution para identificar de manera efectiva el volumen, la cantidad de parámetros y la cantidad de cálculos del modelo, y hacer que el modelo sea liviano; finalmente, reemplazamos la función de pérdida en la caja delimitadora objetivo original con la función de pérdida Efficient Intersection over Union (EloU) para mejorar aún más el rendimiento de detección del modelo YOLOv5s mejorado. Después de las pruebas, la precisión del modelo YOLOv5s mejorado fue del 96.80%, la tasa de recuperación fue del 94.00%, la precisión promedio fue del 93.20% y la velocidad de cuadros fue de 14.01 fps, lo que representó mejoras del 6.6%, 4.4%, 1.0% y 6.1%, respectivamente, en comparación con el modelo YOLOv5s original. El volumen del modelo fue de 9.6 MB, la cantidad de cálculos fue de 13.6 GB y la cantidad de parámetros fue de 5.9 MB, lo que disminuyó en un 29.4%, 14.5% y 13.2% en comparación con el modelo YOLOv5s original, respectivamente. Este modelo puede distinguir eficazmente el diente de león entre los cultivos. Esta investigación puede proporcionar apoyo teórico y técnico para la identificación eficiente de malezas en entornos de campo complejos.