Un estudio sobre la sensibilidad del tamaño de muestra del conjunto de datos de fabricación de fábrica para la clasificación de productos defectuosos basada en CNN
Autores: Kim, Dongbock; Seo, Sat Byul; Yoo, Nam Hyun; Shin, Gisu
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un estudio sobre la sensibilidad del tamaño de muestra del conjunto de datos de fabricación de fábrica para la clasificación de productos defectuosos basada en CNN
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Pequeñas
Medianas empresas
Productos defectuosos
Tecnología de aprendizaje profundo
Sensibilidad al tamaño de la muestra
Rendimiento estable
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
En muchas pequeñas y medianas empresas (PYMEs), los productos defectuosos aún se verifican manualmente en el proceso de fabricación. Recientemente, la clasificación de imágenes aplicando tecnología de aprendizaje profundo ha tenido éxito en clasificar imágenes de productos defectuosos e íntegros, aunque hay pocos casos de su utilización en la práctica. Las PYMEs tienen recursos limitados; por lo tanto, es crucial tomar decisiones cuidadosas al aplicar nuevos métodos. Investigamos la sensibilidad del tamaño de la muestra para determinar el rendimiento estable de los modelos de aprendizaje profundo cuando se aplican al mundo real. Se construyó un modelo secuencial simple y se reconstruyó el conjunto de datos en varios tamaños. Para cada caso, observamos sus indicadores estadísticos, como la precisión, la recuperación, la precisión y la puntuación F1, en el mismo conjunto de datos de prueba. Además, se investigaron los valores de pérdida, precisión y AUROC para el conjunto de datos de validación durante el entrenamiento. Como resultado de la investigación realizada, pudimos confirmar que, con 1000 puntos de datos o más, la precisión superó el 97%. Sin embargo, se necesitaban más de 5000 casos para lograr estabilidad en el modelo, que tenía poca posibilidad de sobreajuste.
Descripción
En muchas pequeñas y medianas empresas (PYMEs), los productos defectuosos aún se verifican manualmente en el proceso de fabricación. Recientemente, la clasificación de imágenes aplicando tecnología de aprendizaje profundo ha tenido éxito en clasificar imágenes de productos defectuosos e íntegros, aunque hay pocos casos de su utilización en la práctica. Las PYMEs tienen recursos limitados; por lo tanto, es crucial tomar decisiones cuidadosas al aplicar nuevos métodos. Investigamos la sensibilidad del tamaño de la muestra para determinar el rendimiento estable de los modelos de aprendizaje profundo cuando se aplican al mundo real. Se construyó un modelo secuencial simple y se reconstruyó el conjunto de datos en varios tamaños. Para cada caso, observamos sus indicadores estadísticos, como la precisión, la recuperación, la precisión y la puntuación F1, en el mismo conjunto de datos de prueba. Además, se investigaron los valores de pérdida, precisión y AUROC para el conjunto de datos de validación durante el entrenamiento. Como resultado de la investigación realizada, pudimos confirmar que, con 1000 puntos de datos o más, la precisión superó el 97%. Sin embargo, se necesitaban más de 5000 casos para lograr estabilidad en el modelo, que tenía poca posibilidad de sobreajuste.