Un estudio sobre el reconocimiento de kale basado en segmentación semántica
Autores: Wu, Huarui; Guo, Wang; Liu, Chang; Sun, Xiang
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un estudio sobre el reconocimiento de kale basado en segmentación semántica
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Agronomía y Ciencia de los Cultivos
Palabras clave
Kale
Segmentación
UperNet
Transformador Swin
Conjunto de datos
Módulo de atención
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
El cultivo de col rizada es un vegetal a granel importante, y la segmentación automática para reconocer la col rizada es fundamental para la gestión efectiva del campo. Sin embargo, los fondos complejos y los detalles de borde ricos en textura dificultan la segmentación fina de la col rizada. Para este fin, construimos un conjunto de datos de col rizada en un escenario de campo real y propusimos un modelo de segmentación semántica UperNet con un transformador Swin como red principal y mejoramos el modelo de acuerdo con las características de crecimiento de la col rizada. En primer lugar, se introduce un módulo de atención de canal (CAM) en el módulo transformador Swin para mejorar la capacidad de representación de la red y mejorar la extracción de información de hojas exteriores de col rizada y bulbo de hojas; en segundo lugar, se mejora la precisión de extracción de los bordes objetivo de la col rizada en la parte de decodificación mediante el diseño de un módulo de refinamiento de atención (ARM); por último, la distribución desigual de clases se resuelve modificando el optimizador y la función de pérdida para resolver el problema de distribución de clases. Los resultados experimentales muestran que el modelo mejorado en este documento tiene un excelente rendimiento en la extracción de características, y la relación promedio de intersección y fusión (mIOU) de la segmentación de col rizada mejorada puede ser de hasta 91.2%, y la precisión promedio de píxeles (mPA) puede ser de hasta 95.2%, lo que es 2.1 puntos porcentuales y 4.7 puntos porcentuales más alto que el modelo UperNet original, respectivamente, y mejora efectivamente el reconocimiento de segmentación de col rizada.
Descripción
El cultivo de col rizada es un vegetal a granel importante, y la segmentación automática para reconocer la col rizada es fundamental para la gestión efectiva del campo. Sin embargo, los fondos complejos y los detalles de borde ricos en textura dificultan la segmentación fina de la col rizada. Para este fin, construimos un conjunto de datos de col rizada en un escenario de campo real y propusimos un modelo de segmentación semántica UperNet con un transformador Swin como red principal y mejoramos el modelo de acuerdo con las características de crecimiento de la col rizada. En primer lugar, se introduce un módulo de atención de canal (CAM) en el módulo transformador Swin para mejorar la capacidad de representación de la red y mejorar la extracción de información de hojas exteriores de col rizada y bulbo de hojas; en segundo lugar, se mejora la precisión de extracción de los bordes objetivo de la col rizada en la parte de decodificación mediante el diseño de un módulo de refinamiento de atención (ARM); por último, la distribución desigual de clases se resuelve modificando el optimizador y la función de pérdida para resolver el problema de distribución de clases. Los resultados experimentales muestran que el modelo mejorado en este documento tiene un excelente rendimiento en la extracción de características, y la relación promedio de intersección y fusión (mIOU) de la segmentación de col rizada mejorada puede ser de hasta 91.2%, y la precisión promedio de píxeles (mPA) puede ser de hasta 95.2%, lo que es 2.1 puntos porcentuales y 4.7 puntos porcentuales más alto que el modelo UperNet original, respectivamente, y mejora efectivamente el reconocimiento de segmentación de col rizada.