Un modelo jerárquico consciente de las características para la detección precisa de manchas de la enfermedad del tizón del tomate: Unet con Visión Mamba y Perspectiva ConvNeXt
Autores: Shi, Dongyuan; Li, Changhong; Shi, Hui; Liang, Longwei; Liu, Huiying; Diao, Ming
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un modelo jerárquico consciente de las características para la detección precisa de manchas de la enfermedad del tizón del tomate: Unet con Visión Mamba y Perspectiva ConvNeXt
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Agronomía y Ciencia de los Cultivos
Palabras clave
Tizón del tomate
Modelo de segmentación
VMC-Unet
Morfologías de lesiones
Vision Mamba
ConvNeXt
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
El tizón del tomate amenazó significativamente el rendimiento y la calidad del tomate, haciendo que la detección precisa de la enfermedad sea esencial para las prácticas agrícolas modernas. Los modelos de segmentación tradicionales a menudo tienen dificultades con la sobre-segmentación y la segmentación perdida, particularmente en fondos complejos y con diversas morfologías de lesiones. Para abordar estos desafíos, propusimos Unet con Vision Mamba y ConvNeXt (VMC-Unet), un modelo de segmentación asimétrico para el análisis cuantitativo del tizón del tomate. Construido sobre el marco Unet, VMC-Unet integró un espinazo paralelo consciente de características que combina módulos ConvNeXt, Vision Mamba y Atrous Spatial Pyramid Pooling (ASPP) para mejorar el enfoque de características espaciales y el procesamiento de información a múltiples escalas. Durante la decodificación, Vision Mamba se incrustó jerárquicamente para recuperar con precisión las complejas morfologías de lesiones a través de un procesamiento de características refinado y un muestreo ascendente eficiente. Se diseñó una función de pérdida conjunta para optimizar el rendimiento del modelo. Experimentos extensos en epidemias de tomate y conjuntos de datos públicos demostraron el rendimiento superior de VMC-Unet, logrando un 97.82% de precisión de píxeles, un 87.94% de puntuación F1 y un 86.75% de mIoU. Estos resultados superaron a los de los modelos de segmentación clásicos, subrayando la efectividad de VMC-Unet en la mitigación de la sobre-segmentación y la sub-segmentación, manteniendo al mismo tiempo una alta precisión de segmentación en fondos complejos. El rendimiento consistente del modelo en diversos conjuntos de datos validó aún más su robustez y potencial de generalización, destacando su aplicabilidad en entornos agrícolas más amplios.
Descripción
El tizón del tomate amenazó significativamente el rendimiento y la calidad del tomate, haciendo que la detección precisa de la enfermedad sea esencial para las prácticas agrícolas modernas. Los modelos de segmentación tradicionales a menudo tienen dificultades con la sobre-segmentación y la segmentación perdida, particularmente en fondos complejos y con diversas morfologías de lesiones. Para abordar estos desafíos, propusimos Unet con Vision Mamba y ConvNeXt (VMC-Unet), un modelo de segmentación asimétrico para el análisis cuantitativo del tizón del tomate. Construido sobre el marco Unet, VMC-Unet integró un espinazo paralelo consciente de características que combina módulos ConvNeXt, Vision Mamba y Atrous Spatial Pyramid Pooling (ASPP) para mejorar el enfoque de características espaciales y el procesamiento de información a múltiples escalas. Durante la decodificación, Vision Mamba se incrustó jerárquicamente para recuperar con precisión las complejas morfologías de lesiones a través de un procesamiento de características refinado y un muestreo ascendente eficiente. Se diseñó una función de pérdida conjunta para optimizar el rendimiento del modelo. Experimentos extensos en epidemias de tomate y conjuntos de datos públicos demostraron el rendimiento superior de VMC-Unet, logrando un 97.82% de precisión de píxeles, un 87.94% de puntuación F1 y un 86.75% de mIoU. Estos resultados superaron a los de los modelos de segmentación clásicos, subrayando la efectividad de VMC-Unet en la mitigación de la sobre-segmentación y la sub-segmentación, manteniendo al mismo tiempo una alta precisión de segmentación en fondos complejos. El rendimiento consistente del modelo en diversos conjuntos de datos validó aún más su robustez y potencial de generalización, destacando su aplicabilidad en entornos agrícolas más amplios.