La transferencia federada de aprendizaje para la clasificación de enfermedades de hojas de arroz en conjuntos de datos multiclientes y en silos cruzados
Autores: Aggarwal, Meenakshi; Khullar, Vikas; Goyal, Nitin; Gautam, Rama; Alblehai, Fahad; Elghatwary, Magdy; Singh, Aman
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
La transferencia federada de aprendizaje para la clasificación de enfermedades de hojas de arroz en conjuntos de datos multiclientes y en silos cruzados
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Agronomía y Ciencia de los Cultivos
Palabras clave
Enfermedades de las hojas de arroz
Agricultura de precisión
Aprendizaje automático
Aprendizaje profundo
Aprendizaje federado
Clasificación de enfermedades de las hojas de arroz
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
Las enfermedades de las hojas de arroz abarcan una serie de afecciones que afectan a las hojas de las plantas de arroz, surgidas de factores como bacterias, hongos, virus y estrés ambiental. La agricultura de precisión aprovecha tecnologías para una producción de cultivos mejorada, siendo la detección de enfermedades un elemento vital. La identificación rápida de enfermedades en las hojas de arroz es fundamental para frenar su propagación y reducir el daño a los cultivos. Sin embargo, diagnosticar manualmente enfermedades del arroz en regiones con vastas áreas agrícolas y pocos expertos resulta sumamente difícil. La utilización de aprendizaje automático (ML) y aprendizaje profundo (DL) para diagnosticar enfermedades en cultivos agrícolas parece ser efectiva y adecuada para una aplicación generalizada. Estos métodos ML/DL no pueden garantizar la privacidad de los datos, ya que implican compartir datos de entrenamiento con un servidor central, pasando por alto consideraciones competitivas y regulatorias. Como solución, el aprendizaje federado (FL) tiene como objetivo facilitar un entrenamiento descentralizado para abordar las limitaciones identificadas del entrenamiento centralizado. Este artículo utiliza el enfoque FL para la clasificación de enfermedades de las hojas de arroz. El manuscrito presenta un enfoque efectivo para la clasificación de enfermedades de las hojas de arroz con una arquitectura federada, garantizando la privacidad de los datos. Hemos compilado un conjunto de datos desequilibrado de imágenes de enfermedades de las hojas de arroz, categorizado en cuatro enfermedades con sus respectivos recuentos de imágenes: tizón bacteriano (1584), mancha marrón (1440), explosión (1600) y tungro (1308). El método propuesto, llamado aprendizaje de transferencia federada (F-TL), mantiene la privacidad para todos los dispositivos conectados utilizando una configuración cliente-servidor descentralizada. Tanto conjuntos de datos IID (independientes e idénticamente distribuidos) como no-IID fueron utilizados para probar el marco de F-TL después del preprocesamiento. Inicialmente, realizamos un análisis de efectividad de CNN y ocho modelos de aprendizaje de transferencia para la clasificación de enfermedades de las hojas de arroz. Entre ellos, MobileNetV2 y EfficientNetB3 superaron a los otros modelos de aprendizaje de transferencia. Posteriormente, entrenamos estos modelos utilizando tanto conjuntos de datos IID como no-IID en un entorno de aprendizaje federado. El rendimiento del marco se evaluó a través de diversos escenarios, comparándolo con modelos de aprendizaje tradicionales y federados. La evaluación consideró métricas como precisión de validación, pérdida y utilización de recursos como CPU y RAM. EfficientNetB3 se destacó en el entrenamiento, logrando una precisión del 99% con una pérdida de 0.1 para ambos conjuntos de datos IID y no-IID. MobilenetV2 mostró una precisión de entrenamiento ligeramente menor, del 98% (IID) y 90% (no-IID) con pérdidas de 0.4 y 0.6, respectivamente. En la evaluación, EfficientNetB3 mantuvo una precisión del 99% con una pérdida de 0.1 para ambos conjuntos de datos, mientras que MobilenetV2 logró una precisión del 90% (IID) y 97% (no-IID) con pérdidas de 0.6 y 0.2, respectivamente. Los resultados indicaron la superioridad del marco F-TL sobre los clasificadores tradicionales de aprendizaje profundo distribuido, demostrando su efectividad tanto en instancias individuales como multicliente. Notablemente, las fortalezas del marco radican en su rentabilidad y garantía de privacidad de datos para dispositivos periféricos con recursos limitados, posicionándolo como una alternativa valiosa para la clasificación de enfermedades de las hojas de arroz en comparación con las herramientas existentes.
Descripción
Las enfermedades de las hojas de arroz abarcan una serie de afecciones que afectan a las hojas de las plantas de arroz, surgidas de factores como bacterias, hongos, virus y estrés ambiental. La agricultura de precisión aprovecha tecnologías para una producción de cultivos mejorada, siendo la detección de enfermedades un elemento vital. La identificación rápida de enfermedades en las hojas de arroz es fundamental para frenar su propagación y reducir el daño a los cultivos. Sin embargo, diagnosticar manualmente enfermedades del arroz en regiones con vastas áreas agrícolas y pocos expertos resulta sumamente difícil. La utilización de aprendizaje automático (ML) y aprendizaje profundo (DL) para diagnosticar enfermedades en cultivos agrícolas parece ser efectiva y adecuada para una aplicación generalizada. Estos métodos ML/DL no pueden garantizar la privacidad de los datos, ya que implican compartir datos de entrenamiento con un servidor central, pasando por alto consideraciones competitivas y regulatorias. Como solución, el aprendizaje federado (FL) tiene como objetivo facilitar un entrenamiento descentralizado para abordar las limitaciones identificadas del entrenamiento centralizado. Este artículo utiliza el enfoque FL para la clasificación de enfermedades de las hojas de arroz. El manuscrito presenta un enfoque efectivo para la clasificación de enfermedades de las hojas de arroz con una arquitectura federada, garantizando la privacidad de los datos. Hemos compilado un conjunto de datos desequilibrado de imágenes de enfermedades de las hojas de arroz, categorizado en cuatro enfermedades con sus respectivos recuentos de imágenes: tizón bacteriano (1584), mancha marrón (1440), explosión (1600) y tungro (1308). El método propuesto, llamado aprendizaje de transferencia federada (F-TL), mantiene la privacidad para todos los dispositivos conectados utilizando una configuración cliente-servidor descentralizada. Tanto conjuntos de datos IID (independientes e idénticamente distribuidos) como no-IID fueron utilizados para probar el marco de F-TL después del preprocesamiento. Inicialmente, realizamos un análisis de efectividad de CNN y ocho modelos de aprendizaje de transferencia para la clasificación de enfermedades de las hojas de arroz. Entre ellos, MobileNetV2 y EfficientNetB3 superaron a los otros modelos de aprendizaje de transferencia. Posteriormente, entrenamos estos modelos utilizando tanto conjuntos de datos IID como no-IID en un entorno de aprendizaje federado. El rendimiento del marco se evaluó a través de diversos escenarios, comparándolo con modelos de aprendizaje tradicionales y federados. La evaluación consideró métricas como precisión de validación, pérdida y utilización de recursos como CPU y RAM. EfficientNetB3 se destacó en el entrenamiento, logrando una precisión del 99% con una pérdida de 0.1 para ambos conjuntos de datos IID y no-IID. MobilenetV2 mostró una precisión de entrenamiento ligeramente menor, del 98% (IID) y 90% (no-IID) con pérdidas de 0.4 y 0.6, respectivamente. En la evaluación, EfficientNetB3 mantuvo una precisión del 99% con una pérdida de 0.1 para ambos conjuntos de datos, mientras que MobilenetV2 logró una precisión del 90% (IID) y 97% (no-IID) con pérdidas de 0.6 y 0.2, respectivamente. Los resultados indicaron la superioridad del marco F-TL sobre los clasificadores tradicionales de aprendizaje profundo distribuido, demostrando su efectividad tanto en instancias individuales como multicliente. Notablemente, las fortalezas del marco radican en su rentabilidad y garantía de privacidad de datos para dispositivos periféricos con recursos limitados, posicionándolo como una alternativa valiosa para la clasificación de enfermedades de las hojas de arroz en comparación con las herramientas existentes.