Un modelo de doble rama que integra CNN y Swin Transformer para una clasificación eficiente de enfermedades de hojas de manzana
Autores: Si, Haiping; Li, Mingchun; Li, Weixia; Zhang, Guipei; Wang, Ming; Li, Feitao; Li, Yanling
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un modelo de doble rama que integra CNN y Swin Transformer para una clasificación eficiente de enfermedades de hojas de manzana
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Ciencias Agrícolas y Biológicas Generales
Palabras clave
Manzanas
Enfermedades
Inteligencia artificial
CNNs
Transformer
Agricultura
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 42
Citaciones: Sin citaciones
Las manzanas, como la cuarta fruta más producida a nivel mundial, desempeñan un papel crucial en la agricultura moderna. Sin embargo, identificar con precisión las enfermedades de las manzanas sigue siendo un desafío significativo, ya que el fracaso en este sentido conlleva pérdidas económicas y representa una amenaza para la seguridad alimentaria. Con el rápido desarrollo de la inteligencia artificial, métodos avanzados de aprendizaje profundo como las redes neuronales convolucionales (CNN) y las tecnologías basadas en Transformer han logrado notables avances en el campo agrícola. En este estudio, proponemos un modelo de doble rama llamado DBCoST, que integra CNN y el Transformer Swin. Las CNN se centran en extraer información local, mientras que los Transformers son conocidos por su capacidad para capturar información global. El modelo tiene como objetivo aprovechar al máximo las ventajas de ambos en la extracción de información local y global. Además, presentamos el módulo de fusión de características (FFM), que comprende un módulo residual y un mecanismo de atención Squeeze-and-Excitation (SE) mejorado, para una fusión y retención más efectivas de la información local y global. En el entorno natural, existen diversas fuentes de ruido, como la superposición de ramas y hojas de manzana, así como la presencia de frutas, que aumentan la complejidad de identificar con precisión las enfermedades en las hojas de manzana. Este desafío único proporciona una sólida base experimental para validar el rendimiento de nuestro modelo. Evaluamos exhaustivamente nuestro modelo realizando experimentos comparativos con otros modelos de clasificación en condiciones idénticas. Los resultados experimentales demuestran que nuestro modelo supera a otros modelos en diversas métricas, incluida la precisión, la recuperación, la precisión y la puntuación F1, logrando valores del 97,32%, 97,33%, 97,40% y 97,36%, respectivamente. Además, comparaciones detalladas de la precisión de nuestro modelo en diferentes enfermedades revelan tasas de precisión superiores al 96% para cada enfermedad. En resumen, nuestro modelo tiene un mejor rendimiento en general, logrando una precisión equilibrada en diferentes enfermedades de las hojas de manzana.
Descripción
Las manzanas, como la cuarta fruta más producida a nivel mundial, desempeñan un papel crucial en la agricultura moderna. Sin embargo, identificar con precisión las enfermedades de las manzanas sigue siendo un desafío significativo, ya que el fracaso en este sentido conlleva pérdidas económicas y representa una amenaza para la seguridad alimentaria. Con el rápido desarrollo de la inteligencia artificial, métodos avanzados de aprendizaje profundo como las redes neuronales convolucionales (CNN) y las tecnologías basadas en Transformer han logrado notables avances en el campo agrícola. En este estudio, proponemos un modelo de doble rama llamado DBCoST, que integra CNN y el Transformer Swin. Las CNN se centran en extraer información local, mientras que los Transformers son conocidos por su capacidad para capturar información global. El modelo tiene como objetivo aprovechar al máximo las ventajas de ambos en la extracción de información local y global. Además, presentamos el módulo de fusión de características (FFM), que comprende un módulo residual y un mecanismo de atención Squeeze-and-Excitation (SE) mejorado, para una fusión y retención más efectivas de la información local y global. En el entorno natural, existen diversas fuentes de ruido, como la superposición de ramas y hojas de manzana, así como la presencia de frutas, que aumentan la complejidad de identificar con precisión las enfermedades en las hojas de manzana. Este desafío único proporciona una sólida base experimental para validar el rendimiento de nuestro modelo. Evaluamos exhaustivamente nuestro modelo realizando experimentos comparativos con otros modelos de clasificación en condiciones idénticas. Los resultados experimentales demuestran que nuestro modelo supera a otros modelos en diversas métricas, incluida la precisión, la recuperación, la precisión y la puntuación F1, logrando valores del 97,32%, 97,33%, 97,40% y 97,36%, respectivamente. Además, comparaciones detalladas de la precisión de nuestro modelo en diferentes enfermedades revelan tasas de precisión superiores al 96% para cada enfermedad. En resumen, nuestro modelo tiene un mejor rendimiento en general, logrando una precisión equilibrada en diferentes enfermedades de las hojas de manzana.