Detección automática de racimos en variedades de uva blanca utilizando algoritmos de aprendizaje profundo YOLOv3, YOLOv4 y YOLOv5
Autores: Sozzi, Marco; Cantalamessa, Silvia; Cogato, Alessia; Kayad, Ahmed; Marinello, Francesco
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Detección automática de racimos en variedades de uva blanca utilizando algoritmos de aprendizaje profundo YOLOv3, YOLOv4 y YOLOv5
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Agronomía y Ciencia de los Cultivos
Palabras clave
Redes neuronales convolucionales
Detección de objetos
Estimación del rendimiento de uva
Modelos YOLO
Velocidad de detección
Precisión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
Durante los últimos años, se han propuesto varias Redes Neuronales Convolucionales para la detección de objetos, caracterizadas por diferentes niveles de precisión y velocidad. En viticultura, la estimación y predicción del rendimiento se utiliza para la gestión eficiente de cultivos, aprovechando técnicas de viticultura de precisión. Las Redes Neuronales Convolucionales para la detección de objetos representan una metodología alternativa para la estimación del rendimiento de uvas, que suele depender de la cosecha manual de plantas de muestra. En este trabajo, se evaluaron seis versiones del algoritmo de detección de objetos You Only Look Once (YOLO) (YOLOv3, YOLOv3-tiny, YOLOv4, YOLOv4-tiny, YOLOv5x y YOLOv5s) para la detección y conteo en tiempo real de racimos de uvas. Se eligieron variedades de uva blanca para este estudio, ya que la identificación de bayas blancas sobre un fondo de hojas es más complicada que las bayas rojas. Los modelos YOLO se entrenaron utilizando un conjunto de datos heterogéneo compuesto por imágenes recuperadas de conjuntos de datos abiertos y adquiridas en el campo en varias condiciones de iluminación, fondo y etapas de crecimiento. Los resultados han mostrado que YOLOv5x y YOLOv4 lograron un 1-score de 0,76 y 0,77, respectivamente, con una velocidad de detección de 31 y 32 FPS. Por otro lado, YOLO5s y YOLOv4-tiny lograron un 1-score de 0,76 y 0,69, respectivamente, con una velocidad de detección de 61 y 196 FPS. El modelo final YOLOv5x para el número de racimos, obtenido considerando la oclusión de racimos, fue capaz de estimar el número de racimos por planta con un error promedio del 13,3% por vid. La mejor combinación de precisión y velocidad se logró con YOLOv4-tiny, que debería considerarse para la estimación en tiempo real del rendimiento de uvas, mientras que YOLOv3 se vio afectado por una compensación de Falsos Positivos-Falsos Negativos, lo que disminuyó el RMSE.
Descripción
Durante los últimos años, se han propuesto varias Redes Neuronales Convolucionales para la detección de objetos, caracterizadas por diferentes niveles de precisión y velocidad. En viticultura, la estimación y predicción del rendimiento se utiliza para la gestión eficiente de cultivos, aprovechando técnicas de viticultura de precisión. Las Redes Neuronales Convolucionales para la detección de objetos representan una metodología alternativa para la estimación del rendimiento de uvas, que suele depender de la cosecha manual de plantas de muestra. En este trabajo, se evaluaron seis versiones del algoritmo de detección de objetos You Only Look Once (YOLO) (YOLOv3, YOLOv3-tiny, YOLOv4, YOLOv4-tiny, YOLOv5x y YOLOv5s) para la detección y conteo en tiempo real de racimos de uvas. Se eligieron variedades de uva blanca para este estudio, ya que la identificación de bayas blancas sobre un fondo de hojas es más complicada que las bayas rojas. Los modelos YOLO se entrenaron utilizando un conjunto de datos heterogéneo compuesto por imágenes recuperadas de conjuntos de datos abiertos y adquiridas en el campo en varias condiciones de iluminación, fondo y etapas de crecimiento. Los resultados han mostrado que YOLOv5x y YOLOv4 lograron un 1-score de 0,76 y 0,77, respectivamente, con una velocidad de detección de 31 y 32 FPS. Por otro lado, YOLO5s y YOLOv4-tiny lograron un 1-score de 0,76 y 0,69, respectivamente, con una velocidad de detección de 61 y 196 FPS. El modelo final YOLOv5x para el número de racimos, obtenido considerando la oclusión de racimos, fue capaz de estimar el número de racimos por planta con un error promedio del 13,3% por vid. La mejor combinación de precisión y velocidad se logró con YOLOv4-tiny, que debería considerarse para la estimación en tiempo real del rendimiento de uvas, mientras que YOLOv3 se vio afectado por una compensación de Falsos Positivos-Falsos Negativos, lo que disminuyó el RMSE.