Despliegue eficiente de modelos de detección de enfermedades en hojas de maní en dispositivos de IA periférica
Autores: Lv, Zekai; Yang, Shangbin; Ma, Shichuang; Wang, Qiang; Sun, Jinti; Du, Linlin; Han, Jiaqi; Guo, Yufeng; Zhang, Hui
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Despliegue eficiente de modelos de detección de enfermedades en hojas de maní en dispositivos de IA periférica
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Ciencias Agrícolas y Biológicas Generales
Palabras clave
Detección de enfermedades en hojas de cultivos
Algoritmos de redes neuronales profundas
Dispositivos de IA en el borde
Optimización eficiente de implementación
Modelo TensorRT
Modelo TensorFlow Lite
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
La inteligente transformación de la detección de enfermedades en hojas de cultivos ha impulsado el uso de algoritmos de redes neuronales profundas para desarrollar modelos de detección de enfermedades más precisos. En entornos con recursos limitados, la implementación de modelos de detección de enfermedades en hojas de cultivos en la nube introduce desafíos como la latencia de comunicación y preocupaciones de privacidad. Los dispositivos de IA en el borde ofrecen una menor latencia de comunicación y una mayor escalabilidad. Para lograr la implementación eficiente de modelos de detección de enfermedades en hojas de cultivos en dispositivos de IA en el borde, se recopiló un conjunto de datos de 700 imágenes que representan manchas de hojas de cacahuate, manchas de quemaduras y enfermedades de óxido. Se utilizó la red YOLOX-Tiny para realizar experimentos de implementación con el modelo de detección de enfermedades en hojas de cacahuate en el Jetson Nano B01. Los experimentos se centraron inicialmente en tres aspectos de optimización de implementación eficiente: la fusión de las unidades lineales rectificadas (ReLU) y las operaciones de convolución, la integración de la Supresión Eficiente de No-Máximo para TensorRT (EfficientNMS_TRT) para acelerar el posprocesamiento dentro del modelo de TensorRT, y la conversión de formatos de modelo de número de muestras, canales, altura, ancho (NCHW) a número de muestras, altura, ancho y canales (NHWC) en el modelo de TensorFlow Lite. Además, se realizaron experimentos para comparar el uso de memoria, el consumo de energía y la latencia de inferencia entre los dos marcos de inferencia, así como para evaluar el rendimiento de detección de video en tiempo real utilizando DeepStream. Los resultados demuestran que la fusión de las funciones de activación ReLU con las operaciones de convolución redujo la latencia de inferencia en un 55.5% en comparación con el uso de la activación de la unidad lineal Sigmoid (SiLU) sola. En el modelo de TensorRT, la integración del módulo EfficientNMS_TRT aceleró el posprocesamiento, lo que llevó a una reducción en la latencia de inferencia del 19.6% y un aumento en los cuadros por segundo (FPS) del 20.4%. En el modelo de TensorFlow Lite, la conversión al formato NHWC disminuyó el tiempo de conversión del modelo en un 88.7% y redujo la latencia de inferencia en un 32.3%. Estos tres métodos de optimización eficiente de implementación redujeron efectivamente la latencia de inferencia y mejoraron la eficiencia de inferencia. Además, una comparación entre los dos marcos reveló que TensorFlow Lite exhibió reducciones en el uso de memoria del 15% al 20% y disminuciones en el consumo de energía del 15% al 25% en comparación con TensorRT. Además, TensorRT logró reducciones en la latencia de inferencia del 53.2% al 55.2% en relación con TensorFlow Lite. En consecuencia, se considera que TensorRT es adecuado para tareas que requieren un rendimiento en tiempo real sólido y baja latencia, mientras que TensorFlow Lite es más apropiado para escenarios con recursos de memoria y energía limitados. Además, se encontró que la integración de DeepStream y EfficientNMS_TRT optimizaba la utilización de memoria y energía, mejorando así la velocidad de detección de video en tiempo real. Se logró una velocidad de detección de 28.7 FPS con una resolución de 1280 x 720. Estos experimentos validan la viabilidad y ventajas de implementar modelos de detección de enfermedades en hojas de cultivos en dispositivos de IA en el borde.
Descripción
La inteligente transformación de la detección de enfermedades en hojas de cultivos ha impulsado el uso de algoritmos de redes neuronales profundas para desarrollar modelos de detección de enfermedades más precisos. En entornos con recursos limitados, la implementación de modelos de detección de enfermedades en hojas de cultivos en la nube introduce desafíos como la latencia de comunicación y preocupaciones de privacidad. Los dispositivos de IA en el borde ofrecen una menor latencia de comunicación y una mayor escalabilidad. Para lograr la implementación eficiente de modelos de detección de enfermedades en hojas de cultivos en dispositivos de IA en el borde, se recopiló un conjunto de datos de 700 imágenes que representan manchas de hojas de cacahuate, manchas de quemaduras y enfermedades de óxido. Se utilizó la red YOLOX-Tiny para realizar experimentos de implementación con el modelo de detección de enfermedades en hojas de cacahuate en el Jetson Nano B01. Los experimentos se centraron inicialmente en tres aspectos de optimización de implementación eficiente: la fusión de las unidades lineales rectificadas (ReLU) y las operaciones de convolución, la integración de la Supresión Eficiente de No-Máximo para TensorRT (EfficientNMS_TRT) para acelerar el posprocesamiento dentro del modelo de TensorRT, y la conversión de formatos de modelo de número de muestras, canales, altura, ancho (NCHW) a número de muestras, altura, ancho y canales (NHWC) en el modelo de TensorFlow Lite. Además, se realizaron experimentos para comparar el uso de memoria, el consumo de energía y la latencia de inferencia entre los dos marcos de inferencia, así como para evaluar el rendimiento de detección de video en tiempo real utilizando DeepStream. Los resultados demuestran que la fusión de las funciones de activación ReLU con las operaciones de convolución redujo la latencia de inferencia en un 55.5% en comparación con el uso de la activación de la unidad lineal Sigmoid (SiLU) sola. En el modelo de TensorRT, la integración del módulo EfficientNMS_TRT aceleró el posprocesamiento, lo que llevó a una reducción en la latencia de inferencia del 19.6% y un aumento en los cuadros por segundo (FPS) del 20.4%. En el modelo de TensorFlow Lite, la conversión al formato NHWC disminuyó el tiempo de conversión del modelo en un 88.7% y redujo la latencia de inferencia en un 32.3%. Estos tres métodos de optimización eficiente de implementación redujeron efectivamente la latencia de inferencia y mejoraron la eficiencia de inferencia. Además, una comparación entre los dos marcos reveló que TensorFlow Lite exhibió reducciones en el uso de memoria del 15% al 20% y disminuciones en el consumo de energía del 15% al 25% en comparación con TensorRT. Además, TensorRT logró reducciones en la latencia de inferencia del 53.2% al 55.2% en relación con TensorFlow Lite. En consecuencia, se considera que TensorRT es adecuado para tareas que requieren un rendimiento en tiempo real sólido y baja latencia, mientras que TensorFlow Lite es más apropiado para escenarios con recursos de memoria y energía limitados. Además, se encontró que la integración de DeepStream y EfficientNMS_TRT optimizaba la utilización de memoria y energía, mejorando así la velocidad de detección de video en tiempo real. Se logró una velocidad de detección de 28.7 FPS con una resolución de 1280 x 720. Estos experimentos validan la viabilidad y ventajas de implementar modelos de detección de enfermedades en hojas de cultivos en dispositivos de IA en el borde.