Yolov8-TEA: método de reconocimiento de brotes tiernos de té basado en el algoritmo de segmentación de instancias
Autores: Wang, Wenbo; Xi, Yidan; Gu, Jinan; Yang, Qiuyue; Pan, Zhiyao; Zhang, Xinzhou; Xu, Gongyue; Zhou, Man
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Yolov8-TEA: método de reconocimiento de brotes tiernos de té basado en el algoritmo de segmentación de instancias
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Agronomía y Ciencia de los Cultivos
Palabras clave
Desarrollo continuo
Tecnología de inteligencia artificial
Agricultura inteligente
Algoritmo de segmentación de instancias
YOLOv8-TEA
Redes neuronales convolucionales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
Con el continuo desarrollo de la tecnología de inteligencia artificial, la transformación de la agricultura tradicional en agricultura inteligente se está acelerando rápidamente. Sin embargo, debido a las diversas posturas de crecimiento de los brotes tiernos y los complejos entornos de crecimiento en las plantas de té, las máquinas tradicionales de recolección de té no pueden seleccionar con precisión los brotes tiernos, y la recolección de té de alta gama y premium todavía depende del trabajo manual, lo que resulta en una baja eficiencia y altos costos. Para abordar estos problemas, se propone un algoritmo de segmentación de instancias llamado YOLOv8-TEA. En primer lugar, este algoritmo se basa en el algoritmo de segmentación de instancias de una sola etapa YOLOv8-seg, reemplazando algunos módulos C2f en la red de extracción de características original con MVB, combinando las ventajas de las redes neuronales convolucionales (CNN) y Transformers, y agregando un módulo C2PSA después del agrupamiento piramidal espacial (SPPF) para integrar mecanismos de convolución y atención. En segundo lugar, se utiliza un método de upsampling dinámico aprendible para reemplazar el upsampling tradicional, y se agrega el módulo CoTAttention, junto con la fusión de convoluciones dilatadas en la cabeza de segmentación para mejorar la capacidad de aprendizaje de la red de fusión de características. Finalmente, a través de experimentos de ablación y experimentos comparativos, el algoritmo mejorado mejora significativamente la precisión de la segmentación mientras reduce efectivamente los parámetros del modelo, con mAP (Box) y mAP (Mask) alcanzando el 86.9% y 86.8%, respectivamente, y los GFLOPs reducidos a 52.7.
Descripción
Con el continuo desarrollo de la tecnología de inteligencia artificial, la transformación de la agricultura tradicional en agricultura inteligente se está acelerando rápidamente. Sin embargo, debido a las diversas posturas de crecimiento de los brotes tiernos y los complejos entornos de crecimiento en las plantas de té, las máquinas tradicionales de recolección de té no pueden seleccionar con precisión los brotes tiernos, y la recolección de té de alta gama y premium todavía depende del trabajo manual, lo que resulta en una baja eficiencia y altos costos. Para abordar estos problemas, se propone un algoritmo de segmentación de instancias llamado YOLOv8-TEA. En primer lugar, este algoritmo se basa en el algoritmo de segmentación de instancias de una sola etapa YOLOv8-seg, reemplazando algunos módulos C2f en la red de extracción de características original con MVB, combinando las ventajas de las redes neuronales convolucionales (CNN) y Transformers, y agregando un módulo C2PSA después del agrupamiento piramidal espacial (SPPF) para integrar mecanismos de convolución y atención. En segundo lugar, se utiliza un método de upsampling dinámico aprendible para reemplazar el upsampling tradicional, y se agrega el módulo CoTAttention, junto con la fusión de convoluciones dilatadas en la cabeza de segmentación para mejorar la capacidad de aprendizaje de la red de fusión de características. Finalmente, a través de experimentos de ablación y experimentos comparativos, el algoritmo mejorado mejora significativamente la precisión de la segmentación mientras reduce efectivamente los parámetros del modelo, con mAP (Box) y mAP (Mask) alcanzando el 86.9% y 86.8%, respectivamente, y los GFLOPs reducidos a 52.7.