Impactos de la eliminación de antecedentes en redes neuronales convolucionales para la clasificación de enfermedades de plantas in situ
Autores: KC, Kamal; Yin, Zhendong; Li, Dasen; Wu, Zhilu
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Impactos de la eliminación de antecedentes en redes neuronales convolucionales para la clasificación de enfermedades de plantas in situ
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Ciencias Agrícolas y Biológicas Generales
Palabras clave
Redes neuronales convolucionales
Segmentación
Sustracción de fondo
Clasificación de imágenes
Fondos limpios
Fondos desordenados
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
Las redes neuronales convolucionales tienen un impacto inmenso en las tareas de visión por computadora. Sin embargo, la precisión de las redes neuronales convolucionales en un conjunto de datos se ve tremendamente afectada cuando las imágenes dentro del conjunto varían mucho. Las imágenes de prueba de hojas de plantas suelen tomarse in situ. Estas imágenes, aparte de la región de interés, contienen partes no deseadas de plantas, suelo, rocas y/o partes del cuerpo humano. La segmentación ayuda a aislar la región objetivo y una red neuronal convolucional profunda clasifica las imágenes con precisión. Por lo tanto, combinamos la segmentación basada en bordes y morfológica, la sustracción de fondo y la red neuronal convolucional para ayudar a mejorar la precisión en conjuntos de imágenes con imágenes que contienen fondos limpios y desordenados. En el sistema propuesto, se aplicó la segmentación para extraer primero las imágenes de hojas en primer plano. Varias imágenes contenían una hoja de interés intercalada entre primeros planos y fondos desfavorables. Se implementó la sustracción de fondo para eliminar la imagen del primer plano seguida de la segmentación para obtener la región de interés. Finalmente, las imágenes fueron clasificadas por una red de clasificación pre-entrenada. Los resultados experimentales en conjuntos de datos de dos, cuatro y ocho clases muestran que el método propuesto logra un 98.7%, 96.7% y 93.57% de precisión mediante los modelos DenseNet121, InceptionV3 y DenseNet121 afinados, respectivamente, en un conjunto de datos limpio. Para conjuntos de datos de dos clases, la precisión obtenida fue aproximadamente un 12% mayor para un conjunto de datos con imágenes tomadas en un fondo homogéneo en comparación con el de un conjunto de imágenes de prueba con un fondo desordenado. Los resultados también sugieren que los conjuntos de imágenes con fondos limpios tienden a comenzar el entrenamiento con una mayor precisión y convergen más rápidamente.
Descripción
Las redes neuronales convolucionales tienen un impacto inmenso en las tareas de visión por computadora. Sin embargo, la precisión de las redes neuronales convolucionales en un conjunto de datos se ve tremendamente afectada cuando las imágenes dentro del conjunto varían mucho. Las imágenes de prueba de hojas de plantas suelen tomarse in situ. Estas imágenes, aparte de la región de interés, contienen partes no deseadas de plantas, suelo, rocas y/o partes del cuerpo humano. La segmentación ayuda a aislar la región objetivo y una red neuronal convolucional profunda clasifica las imágenes con precisión. Por lo tanto, combinamos la segmentación basada en bordes y morfológica, la sustracción de fondo y la red neuronal convolucional para ayudar a mejorar la precisión en conjuntos de imágenes con imágenes que contienen fondos limpios y desordenados. En el sistema propuesto, se aplicó la segmentación para extraer primero las imágenes de hojas en primer plano. Varias imágenes contenían una hoja de interés intercalada entre primeros planos y fondos desfavorables. Se implementó la sustracción de fondo para eliminar la imagen del primer plano seguida de la segmentación para obtener la región de interés. Finalmente, las imágenes fueron clasificadas por una red de clasificación pre-entrenada. Los resultados experimentales en conjuntos de datos de dos, cuatro y ocho clases muestran que el método propuesto logra un 98.7%, 96.7% y 93.57% de precisión mediante los modelos DenseNet121, InceptionV3 y DenseNet121 afinados, respectivamente, en un conjunto de datos limpio. Para conjuntos de datos de dos clases, la precisión obtenida fue aproximadamente un 12% mayor para un conjunto de datos con imágenes tomadas en un fondo homogéneo en comparación con el de un conjunto de imágenes de prueba con un fondo desordenado. Los resultados también sugieren que los conjuntos de imágenes con fondos limpios tienden a comenzar el entrenamiento con una mayor precisión y convergen más rápidamente.