U-net con atención a coordenadas y VGGNet: un algoritmo de segmentación de imágenes de uva basado en la fusión de pirámides de agrupamiento y el mecanismo de doble atención
Autores: Yi, Xiaomei; Zhou, Yue; Wu, Peng; Wang, Guoying; Mo, Lufeng; Chola, Musenge; Fu, Xinyun; Qian, Pengxiang
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
U-net con atención a coordenadas y VGGNet: un algoritmo de segmentación de imágenes de uva basado en la fusión de pirámides de agrupamiento y el mecanismo de doble atención
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Agronomía y Ciencia de los Cultivos
Palabras clave
Clasificación
Enfermedad de la podredumbre negra de la vid
Segmentación
Red U-Net
VGG
Agrupación piramidal espacial atrópica
Módulo ASPP
Módulos de doble atención de canal y espaciales
Red de pirámide de características
Segmentación semántica
Precisión de píxeles
Intersección media sobre unión
Precisión de segmentación
Viñas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
Actualmente, la clasificación de la enfermedad de la podredumbre negra de la vid se basa en evaluar el porcentaje de manchas afectadas en el área total, con un enfoque principal en segmentar con precisión estas manchas en imágenes. Es particularmente desafiante en casos en los que las áreas de lesión son pequeñas y los límites están mal definidos, dificultando la segmentación precisa. En nuestro estudio, presentamos una red U-Net mejorada diseñada para segmentar manchas de podredumbre negra en hojas de vid. Aprovechando VGG como la base de la U-Net, posicionamos estratégicamente el módulo de pirámide espacial atrous (ASPP) en la base de la U-Net para servir como un enlace entre el codificador y el decodificador. Además, se integran módulos de doble atención canal y espacial en el decodificador, junto con una red piramidal de características destinada a fusionar diversos niveles de mapas de características para mejorar la segmentación de regiones enfermas. Nuestro modelo supera en rendimiento a enfoques tradicionales de segmentación semántica de enfermedades de plantas como DeeplabV3+, U-Net y PSPNet, logrando una impresionante precisión de píxeles (PA) y puntajes de intersección media sobre unión (MIoU) del 94.33% y 91.09%, respectivamente. Demostrando un fuerte rendimiento en varios niveles de segmentación de manchas, nuestro método muestra su eficacia en mejorar la precisión de segmentación de manchas de podredumbre negra en vides.
Descripción
Actualmente, la clasificación de la enfermedad de la podredumbre negra de la vid se basa en evaluar el porcentaje de manchas afectadas en el área total, con un enfoque principal en segmentar con precisión estas manchas en imágenes. Es particularmente desafiante en casos en los que las áreas de lesión son pequeñas y los límites están mal definidos, dificultando la segmentación precisa. En nuestro estudio, presentamos una red U-Net mejorada diseñada para segmentar manchas de podredumbre negra en hojas de vid. Aprovechando VGG como la base de la U-Net, posicionamos estratégicamente el módulo de pirámide espacial atrous (ASPP) en la base de la U-Net para servir como un enlace entre el codificador y el decodificador. Además, se integran módulos de doble atención canal y espacial en el decodificador, junto con una red piramidal de características destinada a fusionar diversos niveles de mapas de características para mejorar la segmentación de regiones enfermas. Nuestro modelo supera en rendimiento a enfoques tradicionales de segmentación semántica de enfermedades de plantas como DeeplabV3+, U-Net y PSPNet, logrando una impresionante precisión de píxeles (PA) y puntajes de intersección media sobre unión (MIoU) del 94.33% y 91.09%, respectivamente. Demostrando un fuerte rendimiento en varios niveles de segmentación de manchas, nuestro método muestra su eficacia en mejorar la precisión de segmentación de manchas de podredumbre negra en vides.