MFFSNet: una red CNN de barajado multi-escala ligera para la identificación de enfermedades de trigo en contextos complejos
Autores: Xie, Mingjin; Wu, Jiening; Sun, Jie; Xiao, Lei; Liu, Zhenqi; Yuan, Rui; Duan, Shukai; Wang, Lidan
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
MFFSNet: una red CNN de barajado multi-escala ligera para la identificación de enfermedades de trigo en contextos complejos
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Agronomía y Ciencia de los Cultivos
Palabras clave
Trigo
Enfermedades
Identificación
Modelo
Características
Atención
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
El trigo es uno de los cultivos alimentarios más esenciales a nivel mundial, pero las enfermedades amenazan significativamente su rendimiento y calidad, lo que resulta en pérdidas económicas considerables. La identificación de enfermedades en el trigo enfrenta desafíos, como la interferencia de entornos complejos en el campo, la ineficiencia de los métodos tradicionales de aprendizaje automático y la dificultad para implementar los modelos existentes de aprendizaje profundo. Para abordar estos desafíos, este estudio propone un modelo de red de fusión de características a múltiples escalas (MFFSNet) para la identificación de enfermedades en el trigo en entornos complejos en el campo. MFFSNet incorpora un módulo de extracción y fusión de características a múltiples escalas (MFEF), utilizando convolución inflada para capturar eficientemente diversas características, y sus unidades principales están mejoradas por unidades ShuffleNetV2. También se integra un mecanismo de atención de doble rama (DSA) para mejorar el enfoque del modelo en características críticas, reduciendo la interferencia de fondos complejos. El modelo se caracteriza por su tamaño más pequeño y su velocidad de operación rápida. Los resultados experimentales demuestran que el mecanismo de atención DSA propuesto supera al bloque Squeeze-and-Excitation (SE) que mejor funciona en aproximadamente un 1% en precisión, con el modelo final logrando un 97.38% de precisión y un 97.96% de recuperación en el conjunto de pruebas, que son más altos que los modelos clásicos como GoogleNet, MobileNetV3 y Swin Transformer. Además, el número de parámetros de este modelo es solo de 0.45 M, un tercio del de MobileNetV3 Small, lo que es muy adecuado para implementar en dispositivos con recursos de memoria limitados, demostrando un gran potencial para aplicaciones prácticas en la producción agrícola.
Descripción
El trigo es uno de los cultivos alimentarios más esenciales a nivel mundial, pero las enfermedades amenazan significativamente su rendimiento y calidad, lo que resulta en pérdidas económicas considerables. La identificación de enfermedades en el trigo enfrenta desafíos, como la interferencia de entornos complejos en el campo, la ineficiencia de los métodos tradicionales de aprendizaje automático y la dificultad para implementar los modelos existentes de aprendizaje profundo. Para abordar estos desafíos, este estudio propone un modelo de red de fusión de características a múltiples escalas (MFFSNet) para la identificación de enfermedades en el trigo en entornos complejos en el campo. MFFSNet incorpora un módulo de extracción y fusión de características a múltiples escalas (MFEF), utilizando convolución inflada para capturar eficientemente diversas características, y sus unidades principales están mejoradas por unidades ShuffleNetV2. También se integra un mecanismo de atención de doble rama (DSA) para mejorar el enfoque del modelo en características críticas, reduciendo la interferencia de fondos complejos. El modelo se caracteriza por su tamaño más pequeño y su velocidad de operación rápida. Los resultados experimentales demuestran que el mecanismo de atención DSA propuesto supera al bloque Squeeze-and-Excitation (SE) que mejor funciona en aproximadamente un 1% en precisión, con el modelo final logrando un 97.38% de precisión y un 97.96% de recuperación en el conjunto de pruebas, que son más altos que los modelos clásicos como GoogleNet, MobileNetV3 y Swin Transformer. Además, el número de parámetros de este modelo es solo de 0.45 M, un tercio del de MobileNetV3 Small, lo que es muy adecuado para implementar en dispositivos con recursos de memoria limitados, demostrando un gran potencial para aplicaciones prácticas en la producción agrícola.