Convolución Serpentina Dinámica con Mejora del Mecanismo de Atención para el Reconocimiento del Comportamiento del Ganado Vacuno
Autores: Li, Guangbo; Shi, Guolong; Zhu, Changjie
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Convolución Serpentina Dinámica con Mejora del Mecanismo de Atención para el Reconocimiento del Comportamiento del Ganado Vacuno
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Zootecnia
Palabras clave
Reconocimiento de comportamiento
Ganado vacuno
Algoritmo YOLOv8n_BiF_DSC
Datos de postura
Capa convolucional
Mecanismo de atención
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 8
Citaciones: Sin citaciones
El reconocimiento de comportamiento en ganado vacuno es un componente crucial de la advertencia sobre el comportamiento del ganado y la agricultura inteligente. El reconocimiento tradicional del comportamiento del ganado vacuno enfrenta desafíos tanto en la dificultad de identificación como en la baja precisión. En este estudio, se empleó el algoritmo YOLOv8n_BiF_DSC (Fusión de Convolución de Serpiente Dinámica y Atención BiFormer) para el reconocimiento no intrusivo del comportamiento del ganado vacuno. Los pasos específicos son los siguientes: se observaron 45 bovinos utilizando una cámara fija (UNA LÍNEA DE DEFENSA) y un teléfono móvil (Huawei Mate20Pro) para recopilar y filtrar datos de postura, obteniendo videos utilizables que varían de 1 a 30 minutos de duración. Estos videos cubren nueve comportamientos diferentes en varios escenarios, incluyendo estar de pie, acostarse, montar, pelear, lamer, comer, beber, caminar y buscar. Después de la augmentación de datos, el conjunto de datos comprendió 34,560 muestras. La capa de convolución (CONV) fue mejorada al introducir convolución variable y módulos de convolución dinámica en forma de serpiente. La convolución dinámica en forma de serpiente, que produjo los mejores resultados, amplió el campo receptivo del modelo, percibió dinámicamente características clave del comportamiento del ganado vacuno y mejoró la capacidad de extracción de características del algoritmo. Se introdujeron módulos de mecanismo de atención, incluyendo SE (Redes de Compresión y Excitación), CBAM (Módulo de Atención de Bloque Convolucional), CA (Atención por Coordenadas) y BiFormer (Transformador de Visión con Atención de Enrutamiento Bi-Nivel). El mecanismo de atención BiFormer, seleccionado por su rendimiento óptimo, mejoró la capacidad del algoritmo para capturar dependencias de contexto a larga distancia. La eficiencia computacional del modelo se mejoró a través de la percepción dinámica y consciente de consultas. Los resultados experimentales indicaron que YOLOv8n_BiF_DSC logró los mejores resultados entre todos los algoritmos mejorados en términos de precisión, precisión promedio en IoU 50 y precisión promedio en IoU 50:95. La precisión del reconocimiento del comportamiento del ganado vacuno alcanzó el 93.6%, con la precisión promedio en IoU 50 e IoU 50:95 siendo del 96.5% y 71.5%, respectivamente. Esto representa una mejora del 5.3%, 5.2% y 7.1% sobre el YOLOv8n original. Notablemente, la precisión promedio de reconocimiento de la postura acostada del ganado vacuno alcanzó el 98.9%. En conclusión, el algoritmo YOLOv8n_BiF_DSC demuestra un excelente rendimiento en la extracción de características y fusión de datos de alto nivel, mostrando alta robustez y adaptabilidad. Proporciona apoyo teórico y práctico para el reconocimiento y gestión inteligente del ganado vacuno.
Descripción
El reconocimiento de comportamiento en ganado vacuno es un componente crucial de la advertencia sobre el comportamiento del ganado y la agricultura inteligente. El reconocimiento tradicional del comportamiento del ganado vacuno enfrenta desafíos tanto en la dificultad de identificación como en la baja precisión. En este estudio, se empleó el algoritmo YOLOv8n_BiF_DSC (Fusión de Convolución de Serpiente Dinámica y Atención BiFormer) para el reconocimiento no intrusivo del comportamiento del ganado vacuno. Los pasos específicos son los siguientes: se observaron 45 bovinos utilizando una cámara fija (UNA LÍNEA DE DEFENSA) y un teléfono móvil (Huawei Mate20Pro) para recopilar y filtrar datos de postura, obteniendo videos utilizables que varían de 1 a 30 minutos de duración. Estos videos cubren nueve comportamientos diferentes en varios escenarios, incluyendo estar de pie, acostarse, montar, pelear, lamer, comer, beber, caminar y buscar. Después de la augmentación de datos, el conjunto de datos comprendió 34,560 muestras. La capa de convolución (CONV) fue mejorada al introducir convolución variable y módulos de convolución dinámica en forma de serpiente. La convolución dinámica en forma de serpiente, que produjo los mejores resultados, amplió el campo receptivo del modelo, percibió dinámicamente características clave del comportamiento del ganado vacuno y mejoró la capacidad de extracción de características del algoritmo. Se introdujeron módulos de mecanismo de atención, incluyendo SE (Redes de Compresión y Excitación), CBAM (Módulo de Atención de Bloque Convolucional), CA (Atención por Coordenadas) y BiFormer (Transformador de Visión con Atención de Enrutamiento Bi-Nivel). El mecanismo de atención BiFormer, seleccionado por su rendimiento óptimo, mejoró la capacidad del algoritmo para capturar dependencias de contexto a larga distancia. La eficiencia computacional del modelo se mejoró a través de la percepción dinámica y consciente de consultas. Los resultados experimentales indicaron que YOLOv8n_BiF_DSC logró los mejores resultados entre todos los algoritmos mejorados en términos de precisión, precisión promedio en IoU 50 y precisión promedio en IoU 50:95. La precisión del reconocimiento del comportamiento del ganado vacuno alcanzó el 93.6%, con la precisión promedio en IoU 50 e IoU 50:95 siendo del 96.5% y 71.5%, respectivamente. Esto representa una mejora del 5.3%, 5.2% y 7.1% sobre el YOLOv8n original. Notablemente, la precisión promedio de reconocimiento de la postura acostada del ganado vacuno alcanzó el 98.9%. En conclusión, el algoritmo YOLOv8n_BiF_DSC demuestra un excelente rendimiento en la extracción de características y fusión de datos de alto nivel, mostrando alta robustez y adaptabilidad. Proporciona apoyo teórico y práctico para el reconocimiento y gestión inteligente del ganado vacuno.