Detección de defectos en la superficie de lichis basada en redes neuronales convolucionales profundas con aumento de datos basado en GAN

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Detección de defectos en la superficie de lichis basada en redes neuronales convolucionales profundas con aumento de datos basado en GAN

Autores: Wang, Chenglong; Xiao, Zhifeng

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico

2021

Detección de defectos en la superficie de lichis basada en redes neuronales convolucionales profundas con aumento de datos basado en GAN

Categoría

Ciencias Agrícolas y Biológicas

Subcategoría

Agronomía y Ciencia de los Cultivos

Palabras clave

Detección de defectos en la superficie de frutas

Lichi

Conjunto de datos

Red generativa adversaria

Red neuronal convolucional profunda

Precisión media promedio

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 20

Citaciones: Sin citaciones

El rendimiento de la detección de defectos en la superficie de la fruta se ve fácilmente afectado por factores como el ruido de fondo y la oclusión de follaje. En este estudio, elegimos el lichi como tipo de fruta para investigar su calidad superficial. Los lichis son difíciles de conservar y deben almacenarse a bajas temperaturas para mantenerse frescos. Además, la superficie de los lichis está sujeta a arañazos y grietas durante la cosecha/el procesamiento. Para explorar la viabilidad de la automatización de la detección de superficies defectuosas en los lichis, construimos un conjunto de datos con 3743 muestras divididas en tres categorías, a saber, maduras, defectuosas y podridas. El conjunto de datos original sufre un problema de distribución desequilibrada. Para abordarlo, adoptamos una red generativa adversaria (GAN) basada en transformadores como medio de aumento de datos que puede mejorar efectivamente el conjunto de entrenamiento original con muestras más diversas para reequilibrar las tres categorías. Además, investigamos tres modelos de redes neuronales convolucionales profundas (DCNN), que incluyen SSD-MobileNet V2, Faster RCNN-ResNet50 y Faster RCNN-Inception-ResNet V2, entrenados bajo diferentes configuraciones para un estudio comparativo exhaustivo. Los resultados muestran que los tres modelos demuestran ganancias de rendimiento consistentes en precisión media promedio (mAP), con la aplicación de la mejora basada en GAN. El conjunto de datos reequilibrado también reduce la discrepancia entre categorías, lo que permite que un modelo DCNN sea entrenado de manera equitativa en todas las categorías. Además, los resultados cualitativos muestran que los modelos entrenados bajo la configuración aumentada pueden identificar mejor las regiones críticas y el límite del objeto, lo que conduce a ganancias en mAP. Por último, concluimos que el modelo más rentable, SSD-MobileNet V2, presenta un mAP comparable (91.81%) y una velocidad de inferencia superior (102 FPS), adecuada para la detección en tiempo real en aplicaciones a nivel industrial.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro