Un modelo de transformador de visión enmascarado de entropía de información (IEM-ViT) para el reconocimiento de enfermedades del té
Autores: Zhang, Jiahong; Guo, Honglie; Guo, Jin; Zhang, Jing
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un modelo de transformador de visión enmascarado de entropía de información (IEM-ViT) para el reconocimiento de enfermedades del té
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Agronomía y Ciencia de los Cultivos
Palabras clave
Té
Enfermedades
Reconocimiento
Modelo
Precisión
Entropía de la información
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
El té es una de las bebidas más populares en el mundo. La rápida y precisa identificación de las enfermedades del té es de gran importancia para tomar medidas preventivas específicas. En este artículo, se propuso un modelo de transformación de visión enmascarada de entropía de información (IEM-ViT) para la rápida y precisa identificación de enfermedades del té. El método de ponderación de entropía de información (IEW) se utilizó para calcular la IE de cada segmento de la imagen, de modo que el modelo pudiera aprender la máxima cantidad de conocimiento e información de manera más rápida y precisa. Se utilizó una arquitectura codificador-decodificador asimétrica en el autoencoder enmascarado (MAE), donde el codificador operaba solo en un subconjunto de parches visibles y el decodificador recuperaba los parches enmascarados etiquetados, reconstruyendo los píxeles faltantes para el intercambio de parámetros y la ampliación de datos. Los resultados experimentales mostraron que el IEM-ViT propuesto tenía una precisión del 93,78% para reconocer los siete tipos de enfermedades del té. En comparación con los algoritmos comunes de reconocimiento de imágenes como ResNet18, VGG16 y VGG19, la precisión de reconocimiento mejoró casi un 20%. Además, en comparación con los otros seis métodos publicados de reconocimiento de enfermedades del té, el modelo IEM-ViT propuesto pudo reconocer más tipos de enfermedades del té y la precisión mejoró simultáneamente.
Descripción
El té es una de las bebidas más populares en el mundo. La rápida y precisa identificación de las enfermedades del té es de gran importancia para tomar medidas preventivas específicas. En este artículo, se propuso un modelo de transformación de visión enmascarada de entropía de información (IEM-ViT) para la rápida y precisa identificación de enfermedades del té. El método de ponderación de entropía de información (IEW) se utilizó para calcular la IE de cada segmento de la imagen, de modo que el modelo pudiera aprender la máxima cantidad de conocimiento e información de manera más rápida y precisa. Se utilizó una arquitectura codificador-decodificador asimétrica en el autoencoder enmascarado (MAE), donde el codificador operaba solo en un subconjunto de parches visibles y el decodificador recuperaba los parches enmascarados etiquetados, reconstruyendo los píxeles faltantes para el intercambio de parámetros y la ampliación de datos. Los resultados experimentales mostraron que el IEM-ViT propuesto tenía una precisión del 93,78% para reconocer los siete tipos de enfermedades del té. En comparación con los algoritmos comunes de reconocimiento de imágenes como ResNet18, VGG16 y VGG19, la precisión de reconocimiento mejoró casi un 20%. Además, en comparación con los otros seis métodos publicados de reconocimiento de enfermedades del té, el modelo IEM-ViT propuesto pudo reconocer más tipos de enfermedades del té y la precisión mejoró simultáneamente.