Ecvnet: una red de fusión de redes neuronales convolucionales eficientes y transformadores visuales para la identificación de enfermedades en hojas de tomate
Autores: Zou, Fendong; Hua, Jing; Zhu, Yuanhao; Deng, Jize; He, Ruimin
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Ecvnet: una red de fusión de redes neuronales convolucionales eficientes y transformadores visuales para la identificación de enfermedades en hojas de tomate
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Agronomía y Ciencia de los Cultivos
Palabras clave
Enfermedades de las hojas de tomate
Redes neuronales convolucionales
Transformadores visuales
Modelos de fusión
ECVNet
Crecimiento de plantas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 18
Citaciones: Sin citaciones
Las enfermedades de las hojas de tomate representan una amenaza significativa para el crecimiento y la productividad de las plantas, lo que requiere una identificación precisa y una gestión oportuna de estos problemas. Los modelos existentes para el reconocimiento de enfermedades de las hojas de tomate pueden clasificarse principalmente en Redes Neuronales Convolucionales (CNN) y Transformadores Visuales (VT). Mientras que las CNN destacan en la extracción de características locales, tienen dificultades con el reconocimiento de características globales; por otro lado, los VT son ventajosos para la extracción de características globales pero son menos efectivos en la captura de características locales. Esta discrepancia obstaculiza la mejora del rendimiento de ambos tipos de modelos en la tarea de identificación de enfermedades de las hojas de tomate. Actualmente, los modelos de fusión efectivos que combinan CNN y VT siguen siendo relativamente escasos. Desarrollamos una red de fusión eficiente de CNN y VT llamada ECVNet para el reconocimiento de enfermedades de las hojas de tomate. Específicamente, primero diseñamos un módulo de Atención de Canal Residual (módulo CAR) para centrarnos en las características del canal y mejorar la sensibilidad del modelo a la importancia de los canales de características. A continuación, creamos un módulo de Fusión de Atención Convolucional (módulo CAF) para extraer e integrar de manera efectiva tanto características locales como globales, mejorando así las capacidades de extracción de características espaciales del modelo. Realizamos experimentos extensos utilizando el conjunto de datos de Plant Village y el conjunto de datos AI Challenger 2018, con ECVNet logrando un rendimiento de reconocimiento de vanguardia en ambos casos. Bajo la condición de 100 épocas, ECVNet logró una precisión del 98.88% en el conjunto de datos de Plant Village y del 86.04% en el conjunto de datos AI Challenger 2018. La introducción de ECVNet proporciona una solución efectiva para la identificación de enfermedades de las hojas de plantas.
Descripción
Las enfermedades de las hojas de tomate representan una amenaza significativa para el crecimiento y la productividad de las plantas, lo que requiere una identificación precisa y una gestión oportuna de estos problemas. Los modelos existentes para el reconocimiento de enfermedades de las hojas de tomate pueden clasificarse principalmente en Redes Neuronales Convolucionales (CNN) y Transformadores Visuales (VT). Mientras que las CNN destacan en la extracción de características locales, tienen dificultades con el reconocimiento de características globales; por otro lado, los VT son ventajosos para la extracción de características globales pero son menos efectivos en la captura de características locales. Esta discrepancia obstaculiza la mejora del rendimiento de ambos tipos de modelos en la tarea de identificación de enfermedades de las hojas de tomate. Actualmente, los modelos de fusión efectivos que combinan CNN y VT siguen siendo relativamente escasos. Desarrollamos una red de fusión eficiente de CNN y VT llamada ECVNet para el reconocimiento de enfermedades de las hojas de tomate. Específicamente, primero diseñamos un módulo de Atención de Canal Residual (módulo CAR) para centrarnos en las características del canal y mejorar la sensibilidad del modelo a la importancia de los canales de características. A continuación, creamos un módulo de Fusión de Atención Convolucional (módulo CAF) para extraer e integrar de manera efectiva tanto características locales como globales, mejorando así las capacidades de extracción de características espaciales del modelo. Realizamos experimentos extensos utilizando el conjunto de datos de Plant Village y el conjunto de datos AI Challenger 2018, con ECVNet logrando un rendimiento de reconocimiento de vanguardia en ambos casos. Bajo la condición de 100 épocas, ECVNet logró una precisión del 98.88% en el conjunto de datos de Plant Village y del 86.04% en el conjunto de datos AI Challenger 2018. La introducción de ECVNet proporciona una solución efectiva para la identificación de enfermedades de las hojas de plantas.