Análisis de rendimiento de modelos de detección en tiempo real de Transformer y You Only Look Once para la detección de malezas en el cultivo de maíz
Autores: García-Navarrete, Oscar Leonardo; Camacho-Tamayo, Jesús Hernán; Bregon, Anibal Bregon; Martín-García, Jorge; Navas-Gracia, Luis Manuel
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Análisis de rendimiento de modelos de detección en tiempo real de Transformer y You Only Look Once para la detección de malezas en el cultivo de maíz
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Agronomía y Ciencia de los Cultivos
Palabras clave
Malezas
Desmalezado de precisión
Sensores de imagen
Algoritmos computacionales
Arquitecturas YOLO
RT-DETR
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 42
Citaciones: Sin citaciones
Las malas hierbas son plantas no deseadas e invasoras caracterizadas por su rápido crecimiento y capacidad de competir con los cultivos por recursos esenciales como espacio, agua, nutrientes y luz solar. Esta competencia tiene un impacto negativo en la calidad y productividad de los cultivos. Para reducir la influencia de las malas hierbas, se utiliza el deshierbo de precisión, que emplea sensores de imagen y algoritmos computacionales para identificar plantas y clasificar malas hierbas utilizando imágenes digitales. Este estudio utilizó imágenes de maíz (L.) para detectar cuatro tipos de malas hierbas (, , , y ). Con este propósito, se entrenaron y compararon las arquitecturas YOLO (You Only Look Once), versiones YOLOv8s, YOLOv9s, YOLOv10s y YOLOv11s, junto con una arquitectura basada en RT-DETR (Real-Time Detection Transformer), versión RT-DETR-1. Las arquitecturas YOLO se destacan por su eficiencia en la detección en tiempo real, y RT-DETR-1 permite evaluar el impacto de una arquitectura que prescinde de la Supresión de No Máximo (NMS). El modelo YOLOv9s tuvo el mejor rendimiento general, logrando un mAP@0.5 de 0.834 en 60 épocas y un puntaje F1 de 0.78, lo que demuestra un equilibrio óptimo entre precisión y recuperación, aunque con menos confianza en sus predicciones. Por otro lado, el modelo RT-DETR-1 se destacó por su eficiencia en la convergencia, alcanzando un rendimiento competitivo en solo 58 épocas con un mAP@0.5 de 0.828 y un puntaje F1 de 0.80.
Descripción
Las malas hierbas son plantas no deseadas e invasoras caracterizadas por su rápido crecimiento y capacidad de competir con los cultivos por recursos esenciales como espacio, agua, nutrientes y luz solar. Esta competencia tiene un impacto negativo en la calidad y productividad de los cultivos. Para reducir la influencia de las malas hierbas, se utiliza el deshierbo de precisión, que emplea sensores de imagen y algoritmos computacionales para identificar plantas y clasificar malas hierbas utilizando imágenes digitales. Este estudio utilizó imágenes de maíz (L.) para detectar cuatro tipos de malas hierbas (, , , y ). Con este propósito, se entrenaron y compararon las arquitecturas YOLO (You Only Look Once), versiones YOLOv8s, YOLOv9s, YOLOv10s y YOLOv11s, junto con una arquitectura basada en RT-DETR (Real-Time Detection Transformer), versión RT-DETR-1. Las arquitecturas YOLO se destacan por su eficiencia en la detección en tiempo real, y RT-DETR-1 permite evaluar el impacto de una arquitectura que prescinde de la Supresión de No Máximo (NMS). El modelo YOLOv9s tuvo el mejor rendimiento general, logrando un mAP@0.5 de 0.834 en 60 épocas y un puntaje F1 de 0.78, lo que demuestra un equilibrio óptimo entre precisión y recuperación, aunque con menos confianza en sus predicciones. Por otro lado, el modelo RT-DETR-1 se destacó por su eficiencia en la convergencia, alcanzando un rendimiento competitivo en solo 58 épocas con un mAP@0.5 de 0.828 y un puntaje F1 de 0.80.