Determinación de características óptimas del conjunto de datos para mejorar el rendimiento de YOLO en la detección de objetos agrícolas
Autores: Song, Jisu; Kim, Dongseok; Jeong, Eunji; Park, Jaesung
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Determinación de características óptimas del conjunto de datos para mejorar el rendimiento de YOLO en la detección de objetos agrícolas
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Ciencias Agrícolas y Biológicas Generales
Palabras clave
Avances en inteligencia artificial
Visión por computadora
Tecnologías agrícolas
Conjuntos de datos de imágenes
Modelo de detección de objetos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 48
Citaciones: Sin citaciones
Los avances recientes en inteligencia artificial y visión por computadora han llevado a un progreso significativo en el uso de tecnologías agrícolas para la predicción de rendimientos, detección de plagas y monitoreo en tiempo real de las condiciones de las plantas. Sin embargo, la recolección de conjuntos de datos de imágenes a gran escala y de alta calidad en el sector agrícola sigue siendo un desafío, especialmente para conjuntos de datos especializados como imágenes de enfermedades de plantas. Este estudio analizó los efectos del tamaño de la imagen (320-640+) y el número de etiquetas en el rendimiento de un modelo de detección de objetos basado en YOLO utilizando diversos conjuntos de datos agrícolas para fresas, tomates, chiles y pimientos. El rendimiento del modelo se evaluó utilizando la intersección sobre la unión y la precisión promedio (AP), donde la curva de AP se suavizó utilizando el filtro de Savitzky-Golay y EEM. Los resultados revelaron que aumentar el número de etiquetas mejoró el rendimiento del modelo hasta cierto punto, después de lo cual el rendimiento disminuyó gradualmente. Además, si bien aumentar el tamaño de la imagen de 320 a 640 mejoró sustancialmente el rendimiento del modelo, aumentos adicionales más allá de 640 solo produjeron mejoras marginales. Sin embargo, el tiempo de entrenamiento y el uso de la unidad de procesamiento gráfico escalaron de manera lineal con el aumento del tamaño de las imágenes, ya que las imágenes de mayor tamaño requieren mayores recursos computacionales. Estos hallazgos subrayan la importancia de una estrategia óptima para seleccionar el tamaño de la imagen y la cantidad de etiquetas bajo limitaciones de recursos en el desarrollo de modelos en el mundo real.
Descripción
Los avances recientes en inteligencia artificial y visión por computadora han llevado a un progreso significativo en el uso de tecnologías agrícolas para la predicción de rendimientos, detección de plagas y monitoreo en tiempo real de las condiciones de las plantas. Sin embargo, la recolección de conjuntos de datos de imágenes a gran escala y de alta calidad en el sector agrícola sigue siendo un desafío, especialmente para conjuntos de datos especializados como imágenes de enfermedades de plantas. Este estudio analizó los efectos del tamaño de la imagen (320-640+) y el número de etiquetas en el rendimiento de un modelo de detección de objetos basado en YOLO utilizando diversos conjuntos de datos agrícolas para fresas, tomates, chiles y pimientos. El rendimiento del modelo se evaluó utilizando la intersección sobre la unión y la precisión promedio (AP), donde la curva de AP se suavizó utilizando el filtro de Savitzky-Golay y EEM. Los resultados revelaron que aumentar el número de etiquetas mejoró el rendimiento del modelo hasta cierto punto, después de lo cual el rendimiento disminuyó gradualmente. Además, si bien aumentar el tamaño de la imagen de 320 a 640 mejoró sustancialmente el rendimiento del modelo, aumentos adicionales más allá de 640 solo produjeron mejoras marginales. Sin embargo, el tiempo de entrenamiento y el uso de la unidad de procesamiento gráfico escalaron de manera lineal con el aumento del tamaño de las imágenes, ya que las imágenes de mayor tamaño requieren mayores recursos computacionales. Estos hallazgos subrayan la importancia de una estrategia óptima para seleccionar el tamaño de la imagen y la cantidad de etiquetas bajo limitaciones de recursos en el desarrollo de modelos en el mundo real.