Vldnet: una red de identificación de enfermedades de cultivos ultraligera
Autores: Li, Xiaopeng; Zhang, Yichi; Peng, Yuhan; Li, Shuqin
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Vldnet: una red de identificación de enfermedades de cultivos ultraligera
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Ciencias Agrícolas y Biológicas Generales
Palabras clave
Aprendizaje profundo
Identificación de enfermedades de cultivos
VLDNet
Eficiencia de extracción de características
Velocidad de inferencia
Tamaño de parámetros
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
Los métodos existentes de aprendizaje profundo suelen adoptar estructuras de red más profundas y anchas para lograr un mejor rendimiento. Sin embargo, encontramos que esta regla no se aplica bien a las tareas de identificación de enfermedades de cultivos, lo que nos inspiró a repensar el paradigma de diseño de modelos de identificación de enfermedades. Las enfermedades de los cultivos pertenecen a características detalladas y carecen de patrones obvios. Las estructuras de red más profundas y anchas causarán pérdida de información de características, lo que dañará la eficiencia de identificación. Basándose en esto, este documento diseña una red de identificación de enfermedades muy liviana llamada VLDNet. El módulo básico VLDBlock de VLDNet extrae características intrínsecas a través de una convolución de 1 x 1, y utiliza operaciones lineales económicas para complementar características redundantes y mejorar la eficiencia de extracción de características. En la inferencia, se utiliza tecnología de reparametrización para reducir aún más el tamaño del modelo y mejorar la velocidad de inferencia. VLDNet logra el mejor modelo (SOTA) en términos de latencia-precisión en conjuntos de datos autogenerados y públicos, como un rendimiento equivalente a Swin-Tiny con un tamaño de parámetro de 0.097 MB y 0.04 G operaciones de punto flotante (FLOPs), mientras que reduce el tamaño de parámetro y FLOPs en 297 veces y 111 veces, respectivamente. En pruebas reales, VLDNet puede reconocer 221 imágenes por segundo, lo que es muy superior a modelos de precisión similar. Se espera que este trabajo promueva aún más la aplicación de métodos de identificación de enfermedades de cultivos basados en aprendizaje profundo en la producción práctica.
Descripción
Los métodos existentes de aprendizaje profundo suelen adoptar estructuras de red más profundas y anchas para lograr un mejor rendimiento. Sin embargo, encontramos que esta regla no se aplica bien a las tareas de identificación de enfermedades de cultivos, lo que nos inspiró a repensar el paradigma de diseño de modelos de identificación de enfermedades. Las enfermedades de los cultivos pertenecen a características detalladas y carecen de patrones obvios. Las estructuras de red más profundas y anchas causarán pérdida de información de características, lo que dañará la eficiencia de identificación. Basándose en esto, este documento diseña una red de identificación de enfermedades muy liviana llamada VLDNet. El módulo básico VLDBlock de VLDNet extrae características intrínsecas a través de una convolución de 1 x 1, y utiliza operaciones lineales económicas para complementar características redundantes y mejorar la eficiencia de extracción de características. En la inferencia, se utiliza tecnología de reparametrización para reducir aún más el tamaño del modelo y mejorar la velocidad de inferencia. VLDNet logra el mejor modelo (SOTA) en términos de latencia-precisión en conjuntos de datos autogenerados y públicos, como un rendimiento equivalente a Swin-Tiny con un tamaño de parámetro de 0.097 MB y 0.04 G operaciones de punto flotante (FLOPs), mientras que reduce el tamaño de parámetro y FLOPs en 297 veces y 111 veces, respectivamente. En pruebas reales, VLDNet puede reconocer 221 imágenes por segundo, lo que es muy superior a modelos de precisión similar. Se espera que este trabajo promueva aún más la aplicación de métodos de identificación de enfermedades de cultivos basados en aprendizaje profundo en la producción práctica.