logo móvil
Contáctanos

Modelo yolo v5s mejorado y ligero para el reconocimiento de frutas y tallos de uva

Autores: Zhao, Junhong; Yao, Xingzhi; Wang, Yu; Yi, Zhenfeng; Xie, Yuming; Zhou, Xingxing

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Modelo yolo v5s mejorado y ligero para el reconocimiento de frutas y tallos de uva


Categoría

Ciencias Agrícolas y Biológicas

Subcategoría

Ciencias Agrícolas y Biológicas Generales

Palabras clave

Cosecha mecanizada
Tecnología
Modelo YOLOv5s
Frutas de uva
Tallos
Precisión

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 40

Citaciones: Sin citaciones


Descripción
La cosecha mecanizada es la tecnología clave para resolver el alto costo y la baja eficiencia de la cosecha manual, y la clave para realizar la cosecha mecanizada radica en la identificación y localización precisa y rápida de los objetivos. En este artículo, se mejora un modelo YOLOv5s liviano para identificar eficientemente frutas y tallos de uva. Por un lado, se mejora el módulo CSP en YOLOv5s utilizando el módulo Ghost, reduciendo los parámetros del modelo a través de mapas de características fantasma y operaciones lineales rentables. Por otro lado, se reemplazan las convoluciones tradicionales por convoluciones profundas para reducir aún más la carga computacional del modelo. El modelo se entrena en conjuntos de datos bajo diferentes entornos (luz normal, poca luz, luz fuerte, ruido) para mejorar la generalización y robustez del modelo. El modelo se aplica al reconocimiento de frutas y tallos de uva, y los resultados experimentales muestran que la precisión general, la tasa de recuperación, el mAP y la puntuación F1 del modelo son del 96,8%, 97,7%, 98,6% y 97,2% respectivamente. El tiempo de detección promedio en una GPU es de 4,5 ms, con una velocidad de cuadros de 221 FPS, y el tamaño del peso generado durante el entrenamiento es de 5,8 MB. En comparación con los modelos originales YOLOv5s, YOLOv5m, YOLOv5l y YOLOv5x en el entorno específico de un invernadero de uva, el modelo propuesto mejora la precisión en un 1%, disminuye la tasa de recuperación en un 0,2%, aumenta la puntuación F1 en un 0,4% y mantiene el mismo mAP. En cuanto al tamaño del peso, se reduce en un 61,1% en comparación con el modelo original, y es solo un 1,8% y un 5,5% de los modelos Faster-RCNN y SSD, respectivamente. La velocidad de cuadros se incrementa en un 43,5% en comparación con el modelo original, y es 11,05 veces y 8,84 veces la de los modelos Faster-RCNN y SSD, respectivamente. En una CPU, el tiempo de detección promedio es de 23,9 ms, con una velocidad de cuadros de 41,9 FPS, lo que representa una mejora del 31% sobre el modelo original. Los resultados de la prueba demuestran que el modelo YOLOv5s liviano mejorado propuesto en el estudio, al tiempo que mantiene la precisión, reduce significativamente el tamaño del modelo, mejora la velocidad de reconocimiento y puede proporcionar una identificación y localización rápidas y precisas para la cosecha robótica.

Otros recursos que podrían interesarte

Temas Virtualpro