Alta precisión de segmentación de frutas de durazno en condiciones adversas utilizando Swin Transformer
Autores: Seo, Dasom; Lee, Seul Ki; Kim, Jin Gook; Oh, Il-Seok
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Alta precisión de segmentación de frutas de durazno en condiciones adversas utilizando Swin Transformer
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Ciencias Agrícolas y Biológicas Generales
Palabras clave
Automatización agrícola
Estimación de rendimiento
Cosecha
Monitoreo
Segmentación a nivel de píxeles
Modelo de segmentación de instancias basado en transformadores
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
En el ámbito de la automatización agrícola, la gestión eficiente de tareas como la estimación de rendimiento, la cosecha y el monitoreo es crucial. Mientras que las frutas suelen ser detectadas mediante cuadros delimitadores, la segmentación a nivel de píxeles es esencial para extraer información detallada como el color, la madurez y la forma. Además, si bien estudios anteriores suelen centrarse en entornos y escenas controladas, lograr un rendimiento robusto en condiciones reales de huertos también es imperativo. Para priorizar estos aspectos, proponemos las siguientes dos consideraciones: primero, un nuevo conjunto de datos de imágenes de duraznos diseñado para entornos de huertos ásperos, centrándose en la segmentación a nivel de píxeles para obtener información detallada; y segundo, utilizando un modelo de segmentación de instancias basado en transformadores, específicamente el Transformador Swin como columna vertebral de Mask R-CNN. Logramos resultados superiores en comparación con modelos basados en CNN, alcanzando un AP de 60.2 en el conjunto de datos de imágenes de duraznos propuesto. El enfoque propuesto basado en transformadores destaca especialmente en la detección de duraznos pequeños u oscurecidos, lo que lo hace altamente adecuado para aplicaciones prácticas en el campo. El modelo propuesto logró un AP de 40.4 para objetos pequeños, casi duplicando el de los modelos basados en CNN. Este avance mejora significativamente los sistemas agrícolas automatizados, especialmente en la estimación de rendimiento, la cosecha y el monitoreo de cultivos.
Descripción
En el ámbito de la automatización agrícola, la gestión eficiente de tareas como la estimación de rendimiento, la cosecha y el monitoreo es crucial. Mientras que las frutas suelen ser detectadas mediante cuadros delimitadores, la segmentación a nivel de píxeles es esencial para extraer información detallada como el color, la madurez y la forma. Además, si bien estudios anteriores suelen centrarse en entornos y escenas controladas, lograr un rendimiento robusto en condiciones reales de huertos también es imperativo. Para priorizar estos aspectos, proponemos las siguientes dos consideraciones: primero, un nuevo conjunto de datos de imágenes de duraznos diseñado para entornos de huertos ásperos, centrándose en la segmentación a nivel de píxeles para obtener información detallada; y segundo, utilizando un modelo de segmentación de instancias basado en transformadores, específicamente el Transformador Swin como columna vertebral de Mask R-CNN. Logramos resultados superiores en comparación con modelos basados en CNN, alcanzando un AP de 60.2 en el conjunto de datos de imágenes de duraznos propuesto. El enfoque propuesto basado en transformadores destaca especialmente en la detección de duraznos pequeños u oscurecidos, lo que lo hace altamente adecuado para aplicaciones prácticas en el campo. El modelo propuesto logró un AP de 40.4 para objetos pequeños, casi duplicando el de los modelos basados en CNN. Este avance mejora significativamente los sistemas agrícolas automatizados, especialmente en la estimación de rendimiento, la cosecha y el monitoreo de cultivos.