Hacia la poda inteligente de viñedos mediante la detección directa de áreas de corte
Autores: Pacioni, Elia; Abengózar, Eugenio; Macías, Miguel Macías; García-Orellana, Carlos J.; Gallardo, Ramón; González Velasco, Horacio M.
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Hacia la poda inteligente de viñedos mediante la detección directa de áreas de corte
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Ciencias Agrícolas y Biológicas Generales
Palabras clave
Robots
Viñedos
Técnicas de aprendizaje profundo
Poda
Mask R-CNN
YOLOv8
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
El desarrollo de robots para la poda automática de viñedos utilizando técnicas de aprendizaje profundo parece factible a medio plazo. En este contexto, es esencial proponer y estudiar soluciones que puedan implementarse en hardware portátil, con capacidades de inteligencia artificial pero potencia de cálculo reducida. En este documento, proponemos un enfoque novedoso para la poda de viñedos mediante la detección directa de áreas de corte en tiempo real comparando el rendimiento de Mask R-CNN y YOLOv8. Las arquitecturas de segmentación de objetos estudiadas son capaces de segmentar la imagen localizando el tronco, los brotes de vid podados y no podados. Nuestro estudio analiza el rendimiento de ambos marcos en términos de eficiencia de segmentación y tiempos de inferencia en una GPU Jetson AGX Orin. Para comparar la eficiencia de segmentación, utilizamos las métricas mAP50 y AP50 por categoría. Nuestros resultados muestran que YOLOv8 es superior tanto en eficiencia de segmentación como en tiempo de inferencia. Específicamente, YOLOv8-S muestra el mejor equilibrio entre eficiencia y tiempo de inferencia, mostrando un mAP50 de 0.883 y un AP50 de 0.748 para la clase de brotes, con un tiempo de inferencia de alrededor de 55 ms en un Jetson AGX Orin.
Descripción
El desarrollo de robots para la poda automática de viñedos utilizando técnicas de aprendizaje profundo parece factible a medio plazo. En este contexto, es esencial proponer y estudiar soluciones que puedan implementarse en hardware portátil, con capacidades de inteligencia artificial pero potencia de cálculo reducida. En este documento, proponemos un enfoque novedoso para la poda de viñedos mediante la detección directa de áreas de corte en tiempo real comparando el rendimiento de Mask R-CNN y YOLOv8. Las arquitecturas de segmentación de objetos estudiadas son capaces de segmentar la imagen localizando el tronco, los brotes de vid podados y no podados. Nuestro estudio analiza el rendimiento de ambos marcos en términos de eficiencia de segmentación y tiempos de inferencia en una GPU Jetson AGX Orin. Para comparar la eficiencia de segmentación, utilizamos las métricas mAP50 y AP50 por categoría. Nuestros resultados muestran que YOLOv8 es superior tanto en eficiencia de segmentación como en tiempo de inferencia. Específicamente, YOLOv8-S muestra el mejor equilibrio entre eficiencia y tiempo de inferencia, mostrando un mAP50 de 0.883 y un AP50 de 0.748 para la clase de brotes, con un tiempo de inferencia de alrededor de 55 ms en un Jetson AGX Orin.