Investigación sobre el Método de Conteo Dinámico de Cerdos Basado en YOLOv7 Mejorado Combinado con DeepSORT
Autores: Shao, Xiaobao; Liu, Chengcheng; Zhou, Zhixuan; Xue, Wenjing; Zhang, Guoye; Liu, Jianyu; Yan, Hongwen
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Investigación sobre el Método de Conteo Dinámico de Cerdos Basado en YOLOv7 Mejorado Combinado con DeepSORT
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Zootecnia
Palabras clave
Inventario de cerdos
Aprendizaje profundo
YOLOv7
DeepSORT
Método de conteo
Basado en video
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 11
Citaciones: Sin citaciones
Un inventario de cerdos es un componente crucial para lograr una agricultura precisa y a gran escala. En entornos complejos de pocilgas, debido a las reacciones de estrés de los cerdos y las frecuentes obstrucciones, es un desafío contarlos de manera precisa y automática. Esta dificultad contrasta con la mayoría de los estudios actuales de aprendizaje profundo, que se basan en vistas aéreas o imágenes estáticas para el conteo. Esta investigación propone un método de conteo dinámico basado en video, combinando YOLOv7 con DeepSORT. Al utilizar la estructura de red YOLOv7 y optimizar las operaciones de convolución de 3 x 3 en la red principal ELAN-W con PConv, el modelo reduce la demanda computacional y mejora la velocidad de inferencia sin sacrificar la precisión. Para asegurar que la red adquiera información precisa de percepción de posición en ángulos oblicuos y extraiga información semántica rica, introducimos el mecanismo de atención por coordenadas (CA) antes de los tres caminos de re-referencialización (REPConv) en la red principal, mejorando la robustez en escenarios complejos. Los resultados experimentales muestran que, en comparación con el modelo original, el modelo mejorado aumenta el mAP en 3.24, 0.05 y 1.00 puntos porcentuales para los conjuntos de datos de conteo de cerdos oblicuos, aéreos y todos, respectivamente, mientras reduce el costo computacional en 3.6 GFLOPS. El YOLOv7 mejorado supera a YOLOv5, YOLOv4, YOLOv3, Faster RCNN y SSD en detección de objetivos con mejoras en mAP de 2.07, 5.20, 2.16, 7.05 y 19.73 puntos porcentuales, respectivamente. En experimentos de conteo dinámico, el YOLOv7 mejorado combinado con DeepSORT fue probado en videos con conteos totales de cerdos de 144, 201, 285 y 295, obteniendo errores de -3, -3, -4 y -26, respectivamente, con una precisión promedio del 96.58% y un FPS de 22. Esto demuestra la capacidad del modelo para realizar el conteo en tiempo real de cerdos en diversas escenas, proporcionando datos y referencias valiosas para la investigación de conteo automatizado de cerdos.
Descripción
Un inventario de cerdos es un componente crucial para lograr una agricultura precisa y a gran escala. En entornos complejos de pocilgas, debido a las reacciones de estrés de los cerdos y las frecuentes obstrucciones, es un desafío contarlos de manera precisa y automática. Esta dificultad contrasta con la mayoría de los estudios actuales de aprendizaje profundo, que se basan en vistas aéreas o imágenes estáticas para el conteo. Esta investigación propone un método de conteo dinámico basado en video, combinando YOLOv7 con DeepSORT. Al utilizar la estructura de red YOLOv7 y optimizar las operaciones de convolución de 3 x 3 en la red principal ELAN-W con PConv, el modelo reduce la demanda computacional y mejora la velocidad de inferencia sin sacrificar la precisión. Para asegurar que la red adquiera información precisa de percepción de posición en ángulos oblicuos y extraiga información semántica rica, introducimos el mecanismo de atención por coordenadas (CA) antes de los tres caminos de re-referencialización (REPConv) en la red principal, mejorando la robustez en escenarios complejos. Los resultados experimentales muestran que, en comparación con el modelo original, el modelo mejorado aumenta el mAP en 3.24, 0.05 y 1.00 puntos porcentuales para los conjuntos de datos de conteo de cerdos oblicuos, aéreos y todos, respectivamente, mientras reduce el costo computacional en 3.6 GFLOPS. El YOLOv7 mejorado supera a YOLOv5, YOLOv4, YOLOv3, Faster RCNN y SSD en detección de objetivos con mejoras en mAP de 2.07, 5.20, 2.16, 7.05 y 19.73 puntos porcentuales, respectivamente. En experimentos de conteo dinámico, el YOLOv7 mejorado combinado con DeepSORT fue probado en videos con conteos totales de cerdos de 144, 201, 285 y 295, obteniendo errores de -3, -3, -4 y -26, respectivamente, con una precisión promedio del 96.58% y un FPS de 22. Esto demuestra la capacidad del modelo para realizar el conteo en tiempo real de cerdos en diversas escenas, proporcionando datos y referencias valiosas para la investigación de conteo automatizado de cerdos.