Estudio sobre el Modelo de Clasificación de Plagas del Té Utilizando un Transformador de Codificación de Región de Interés Iterativa Embebida y Convolucional
Autores: Zhan, Baishao; Li, Ming; Luo, Wei; Li, Peng; Li, Xiaoli; Zhang, Hailiang
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Estudio sobre el Modelo de Clasificación de Plagas del Té Utilizando un Transformador de Codificación de Región de Interés Iterativa Embebida y Convolucional
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Biología
Palabras clave
Enfermedades del té
Visión por computadora
Modelo IterationVIT
Clasificación
Diagnóstico
Convolución
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 17
Citaciones: Sin citaciones
Las enfermedades del té son una de las principales causas de reducción del rendimiento del té, y el uso de visión por computadora para la clasificación y diagnóstico es un medio efectivo para la gestión de enfermedades del té. Sin embargo, la ubicación aleatoria de las lesiones, la alta similitud de síntomas y el fondo complejo dificultan el reconocimiento y la clasificación de las imágenes del té. Por lo tanto, este artículo propone un modelo de diagnóstico de enfermedades del té IterationVIT que integra un transformador convolucional e iterativo. La convolución consiste en una capa de cuello de botella superpuesta para extraer las características locales de las hojas de té. El algoritmo iterativo incorpora el mecanismo de atención y la operación de interpolación bilineal para obtener información sobre la ubicación de la enfermedad al actualizar continuamente la región de interés en la información de ubicación. El módulo del transformador utiliza un mecanismo de atención de múltiples cabezas para la extracción de características globales. Se utilizaron un total de 3544 imágenes de manchas rojas en las hojas, manchas de algas, enfermedad del ojo de pájaro, marchitez gris, manchas blancas, antracnosis, marchitez marrón y hojas de té saludables recolectadas bajo luz natural como muestras e ingresadas en el modelo IterationVIT para entrenamiento. Los resultados muestran que cuando el tamaño del parche es 16, el modelo tuvo un mejor rendimiento con una precisión de clasificación de IterationVIT del 98% y una medida F1 del 96.5%, lo que es superior a métodos convencionales como VIT, Efficient, Shuffle, Mobile, Vgg, etc. Para verificar la robustez del modelo, las imágenes originales del conjunto de prueba fueron desenfocadas, se añadió ruido y se resaltaron, y luego las imágenes se ingresaron en el modelo IterationVIT. La precisión de clasificación aún alcanzó más del 80%. Cuando se seleccionó aleatoriamente el 60% del conjunto de entrenamiento, la precisión de clasificación del conjunto de prueba del modelo IterationVIT fue un 8% superior a la de los modelos convencionales, con la capacidad de analizar menos muestras. La generalización del modelo se realizó utilizando tres conjuntos de datos públicos de hojas de plantas, y los resultados experimentales lograron niveles de generalización comparables a los datos de este artículo. Finalmente, este artículo visualizó e interpretó el modelo utilizando el método CAM para obtener el mapa térmico a nivel de píxel de las enfermedades del té, y los resultados muestran que el modelo IterationVIT establecido puede capturar con precisión la ubicación de las enfermedades, lo que verifica aún más la efectividad del modelo.
Descripción
Las enfermedades del té son una de las principales causas de reducción del rendimiento del té, y el uso de visión por computadora para la clasificación y diagnóstico es un medio efectivo para la gestión de enfermedades del té. Sin embargo, la ubicación aleatoria de las lesiones, la alta similitud de síntomas y el fondo complejo dificultan el reconocimiento y la clasificación de las imágenes del té. Por lo tanto, este artículo propone un modelo de diagnóstico de enfermedades del té IterationVIT que integra un transformador convolucional e iterativo. La convolución consiste en una capa de cuello de botella superpuesta para extraer las características locales de las hojas de té. El algoritmo iterativo incorpora el mecanismo de atención y la operación de interpolación bilineal para obtener información sobre la ubicación de la enfermedad al actualizar continuamente la región de interés en la información de ubicación. El módulo del transformador utiliza un mecanismo de atención de múltiples cabezas para la extracción de características globales. Se utilizaron un total de 3544 imágenes de manchas rojas en las hojas, manchas de algas, enfermedad del ojo de pájaro, marchitez gris, manchas blancas, antracnosis, marchitez marrón y hojas de té saludables recolectadas bajo luz natural como muestras e ingresadas en el modelo IterationVIT para entrenamiento. Los resultados muestran que cuando el tamaño del parche es 16, el modelo tuvo un mejor rendimiento con una precisión de clasificación de IterationVIT del 98% y una medida F1 del 96.5%, lo que es superior a métodos convencionales como VIT, Efficient, Shuffle, Mobile, Vgg, etc. Para verificar la robustez del modelo, las imágenes originales del conjunto de prueba fueron desenfocadas, se añadió ruido y se resaltaron, y luego las imágenes se ingresaron en el modelo IterationVIT. La precisión de clasificación aún alcanzó más del 80%. Cuando se seleccionó aleatoriamente el 60% del conjunto de entrenamiento, la precisión de clasificación del conjunto de prueba del modelo IterationVIT fue un 8% superior a la de los modelos convencionales, con la capacidad de analizar menos muestras. La generalización del modelo se realizó utilizando tres conjuntos de datos públicos de hojas de plantas, y los resultados experimentales lograron niveles de generalización comparables a los datos de este artículo. Finalmente, este artículo visualizó e interpretó el modelo utilizando el método CAM para obtener el mapa térmico a nivel de píxel de las enfermedades del té, y los resultados muestran que el modelo IterationVIT establecido puede capturar con precisión la ubicación de las enfermedades, lo que verifica aún más la efectividad del modelo.