Detección en tiempo real y conteo de espigas de trigo basado en YOLOv10 mejorado
Autores: Guan, Sitong; Lin, Yiming; Lin, Guoyu; Su, Peisen; Huang, Siluo; Meng, Xianyong; Liu, Pingzeng; Yan, Jun
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Detección en tiempo real y conteo de espigas de trigo basado en YOLOv10 mejorado
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Agronomía y Ciencia de los Cultivos
Palabras clave
Trigo
Espigas
Detección
Algoritmo
Modelo YOLOv10
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
El trigo es uno de los cultivos alimentarios más cruciales a nivel mundial, ya que su rendimiento impacta directamente en la seguridad alimentaria global. La detección y conteo precisos de las espigas de trigo son esenciales para monitorear el crecimiento del trigo, predecir el rendimiento y gestionar los campos. Sin embargo, los métodos actuales enfrentan desafíos como la variación en el tamaño de las espigas, sombreado, interferencia de malezas y distribución densa. Los enfoques convencionales de aprendizaje automático han abordado parcialmente estos desafíos, pero se ven obstaculizados por la precisión limitada en la detección, complejidades en la extracción de características y poca robustez bajo condiciones de campo complejas. En este documento, proponemos un algoritmo YOLOv10 mejorado que mejora significativamente la extracción de características y las capacidades de detección del modelo. Esto se logra mediante la introducción de una red piramidal de características bidireccionales (BiFPN), un módulo de atención separado y de mejora (SEAM) y una red de contexto global (GCNet). BiFPN aprovecha tanto las rutas bidireccionales de arriba hacia abajo como de abajo hacia arriba para lograr una fusión de características a múltiples escalas, mejorando el rendimiento en la detección de objetivos de diversas escalas. SEAM mejora la calidad de representación de características y el rendimiento del modelo en entornos complejos al aumentar por separado el mecanismo de atención para características de canal y espaciales. GCNet captura dependencias a larga distancia en la imagen a través del bloque de contexto global, lo que permite que el modelo procese información compleja de manera más precisa. Los resultados experimentales demuestran que nuestro método logró una precisión del 93.69%, una recuperación del 91.70% y una precisión promedio (mAP) del 95.10% en la detección de espigas de trigo, superando al modelo de referencia YOLOv10 en un 2.02% en precisión, 2.92% en recuperación y 1.56% en mAP. Además, el coeficiente de determinación (R) entre las espigas de trigo detectadas y contadas manualmente fue de 0.96, con un error absoluto medio (MAE) de 3.57 y un error cuadrático medio (RMSE) de 4.09, lo que indica una fuerte correlación y alta precisión. El algoritmo YOLOv10 mejorado resuelve efectivamente el difícil problema de la detección de espigas de trigo en condiciones de campo complejas, brindando un sólido apoyo para la producción e investigación agrícola.
Descripción
El trigo es uno de los cultivos alimentarios más cruciales a nivel mundial, ya que su rendimiento impacta directamente en la seguridad alimentaria global. La detección y conteo precisos de las espigas de trigo son esenciales para monitorear el crecimiento del trigo, predecir el rendimiento y gestionar los campos. Sin embargo, los métodos actuales enfrentan desafíos como la variación en el tamaño de las espigas, sombreado, interferencia de malezas y distribución densa. Los enfoques convencionales de aprendizaje automático han abordado parcialmente estos desafíos, pero se ven obstaculizados por la precisión limitada en la detección, complejidades en la extracción de características y poca robustez bajo condiciones de campo complejas. En este documento, proponemos un algoritmo YOLOv10 mejorado que mejora significativamente la extracción de características y las capacidades de detección del modelo. Esto se logra mediante la introducción de una red piramidal de características bidireccionales (BiFPN), un módulo de atención separado y de mejora (SEAM) y una red de contexto global (GCNet). BiFPN aprovecha tanto las rutas bidireccionales de arriba hacia abajo como de abajo hacia arriba para lograr una fusión de características a múltiples escalas, mejorando el rendimiento en la detección de objetivos de diversas escalas. SEAM mejora la calidad de representación de características y el rendimiento del modelo en entornos complejos al aumentar por separado el mecanismo de atención para características de canal y espaciales. GCNet captura dependencias a larga distancia en la imagen a través del bloque de contexto global, lo que permite que el modelo procese información compleja de manera más precisa. Los resultados experimentales demuestran que nuestro método logró una precisión del 93.69%, una recuperación del 91.70% y una precisión promedio (mAP) del 95.10% en la detección de espigas de trigo, superando al modelo de referencia YOLOv10 en un 2.02% en precisión, 2.92% en recuperación y 1.56% en mAP. Además, el coeficiente de determinación (R) entre las espigas de trigo detectadas y contadas manualmente fue de 0.96, con un error absoluto medio (MAE) de 3.57 y un error cuadrático medio (RMSE) de 4.09, lo que indica una fuerte correlación y alta precisión. El algoritmo YOLOv10 mejorado resuelve efectivamente el difícil problema de la detección de espigas de trigo en condiciones de campo complejas, brindando un sólido apoyo para la producción e investigación agrícola.