logo móvil
Contáctanos

Detección de defectos en la superficie de lichis basada en redes neuronales convolucionales profundas con aumento de datos basado en GAN

Autores: Wang, Chenglong; Xiao, Zhifeng

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico
2021

Detección de defectos en la superficie de lichis basada en redes neuronales convolucionales profundas con aumento de datos basado en GAN


Categoría

Ciencias Agrícolas y Biológicas

Subcategoría

Agronomía y Ciencia de los Cultivos

Palabras clave

Detección de defectos en la superficie de frutas
Lichi
Conjunto de datos
Red generativa adversaria
Red neuronal convolucional profunda
Precisión media promedio

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 20

Citaciones: Sin citaciones


Descripción
El rendimiento de la detección de defectos en la superficie de la fruta se ve fácilmente afectado por factores como el ruido de fondo y la oclusión de follaje. En este estudio, elegimos el lichi como tipo de fruta para investigar su calidad superficial. Los lichis son difíciles de conservar y deben almacenarse a bajas temperaturas para mantenerse frescos. Además, la superficie de los lichis está sujeta a arañazos y grietas durante la cosecha/el procesamiento. Para explorar la viabilidad de la automatización de la detección de superficies defectuosas en los lichis, construimos un conjunto de datos con 3743 muestras divididas en tres categorías, a saber, maduras, defectuosas y podridas. El conjunto de datos original sufre un problema de distribución desequilibrada. Para abordarlo, adoptamos una red generativa adversaria (GAN) basada en transformadores como medio de aumento de datos que puede mejorar efectivamente el conjunto de entrenamiento original con muestras más diversas para reequilibrar las tres categorías. Además, investigamos tres modelos de redes neuronales convolucionales profundas (DCNN), que incluyen SSD-MobileNet V2, Faster RCNN-ResNet50 y Faster RCNN-Inception-ResNet V2, entrenados bajo diferentes configuraciones para un estudio comparativo exhaustivo. Los resultados muestran que los tres modelos demuestran ganancias de rendimiento consistentes en precisión media promedio (mAP), con la aplicación de la mejora basada en GAN. El conjunto de datos reequilibrado también reduce la discrepancia entre categorías, lo que permite que un modelo DCNN sea entrenado de manera equitativa en todas las categorías. Además, los resultados cualitativos muestran que los modelos entrenados bajo la configuración aumentada pueden identificar mejor las regiones críticas y el límite del objeto, lo que conduce a ganancias en mAP. Por último, concluimos que el modelo más rentable, SSD-MobileNet V2, presenta un mAP comparable (91.81%) y una velocidad de inferencia superior (102 FPS), adecuada para la detección en tiempo real en aplicaciones a nivel industrial.

Otros recursos que podrían interesarte

Temas Virtualpro