Clustering y Clasificación Automática de Enfermedades de las Hojas de Café Basado en un Enfoque Ampliado de Estimación de Densidad del Núcleo
Autores: Hasan, Reem Ibrahim; Yusuf, Suhaila Mohd; Mohd Rahim, Mohd Shafry; Alzubaidi, Laith
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Clustering y Clasificación Automática de Enfermedades de las Hojas de Café Basado en un Enfoque Ampliado de Estimación de Densidad del Núcleo
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Botánica
Palabras clave
Métodos
Enfermedad de las plantas
Imágenes
Clasificación
Marco
Síntomas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 13
Citaciones: Sin citaciones
Los métodos actuales de clasificación de imágenes de enfermedades de las plantas se ven principalmente afectados por la fase de entrenamiento y las características del conjunto de datos objetivo. La recolección de muestras de plantas durante diferentes etapas de infección del ciclo de vida de las hojas consume mucho tiempo. Sin embargo, estas muestras pueden presentar múltiples síntomas que comparten las mismas características pero con diferentes densidades. El etiquetado manual de tales muestras requiere un trabajo laborioso exhaustivo que puede contener errores y corromper la fase de entrenamiento. Además, el etiquetado y la anotación consideran la enfermedad dominante y descuidan la enfermedad menor, lo que lleva a una clasificación errónea. Este documento propone un marco de diagnóstico de enfermedades de hojas totalmente automatizado que extrae la región de interés basado en un proceso de color modificado, según el cual el síndrome se agrupa de forma autónoma utilizando una estimación de densidad de kernel gaussiano extendido y la probabilidad del vecindario compartido más cercano. Cada grupo de síntomas se presenta al clasificador de forma independiente. El objetivo es agrupar síntomas utilizando un método no paramétrico, disminuir el error de clasificación y reducir la necesidad de un conjunto de datos a gran escala para entrenar al clasificador. Para evaluar la eficiencia del marco propuesto, se seleccionaron conjuntos de datos de hojas de café para evaluar el rendimiento del marco debido a la amplia variedad de demostraciones de características en diferentes niveles de infecciones. Se compararon varios kernels con su selector de ancho de banda apropiado. Las mejores probabilidades se lograron con el kernel gaussiano extendido propuesto, que conecta las lesiones vecinas en un grupo de síntomas, donde no hay necesidad de ningún conjunto influyente que guíe hacia el grupo correcto. Los grupos se presentan con una prioridad igual a un clasificador ResNet50, por lo que la clasificación errónea se reduce con una precisión de hasta el 98%.
Descripción
Los métodos actuales de clasificación de imágenes de enfermedades de las plantas se ven principalmente afectados por la fase de entrenamiento y las características del conjunto de datos objetivo. La recolección de muestras de plantas durante diferentes etapas de infección del ciclo de vida de las hojas consume mucho tiempo. Sin embargo, estas muestras pueden presentar múltiples síntomas que comparten las mismas características pero con diferentes densidades. El etiquetado manual de tales muestras requiere un trabajo laborioso exhaustivo que puede contener errores y corromper la fase de entrenamiento. Además, el etiquetado y la anotación consideran la enfermedad dominante y descuidan la enfermedad menor, lo que lleva a una clasificación errónea. Este documento propone un marco de diagnóstico de enfermedades de hojas totalmente automatizado que extrae la región de interés basado en un proceso de color modificado, según el cual el síndrome se agrupa de forma autónoma utilizando una estimación de densidad de kernel gaussiano extendido y la probabilidad del vecindario compartido más cercano. Cada grupo de síntomas se presenta al clasificador de forma independiente. El objetivo es agrupar síntomas utilizando un método no paramétrico, disminuir el error de clasificación y reducir la necesidad de un conjunto de datos a gran escala para entrenar al clasificador. Para evaluar la eficiencia del marco propuesto, se seleccionaron conjuntos de datos de hojas de café para evaluar el rendimiento del marco debido a la amplia variedad de demostraciones de características en diferentes niveles de infecciones. Se compararon varios kernels con su selector de ancho de banda apropiado. Las mejores probabilidades se lograron con el kernel gaussiano extendido propuesto, que conecta las lesiones vecinas en un grupo de síntomas, donde no hay necesidad de ningún conjunto influyente que guíe hacia el grupo correcto. Los grupos se presentan con una prioridad igual a un clasificador ResNet50, por lo que la clasificación errónea se reduce con una precisión de hasta el 98%.