Selección de datos de entrenamiento por variables categóricas para una mejor predicción de eventos raros en la línea de producción de múltiples productos
Autores: Xu, Dongting; Zhang, Zhisheng; Shi, Jinfei
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Selección de datos de entrenamiento por variables categóricas para una mejor predicción de eventos raros en la línea de producción de múltiples productos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Fabricantes
Datos
Datos de entrenamiento
Modelos de aprendizaje profundo
Series temporales
Variables categóricas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 45
Citaciones: Sin citaciones
Los fabricantes están luchando por utilizar datos de múltiples líneas de producción de productos para predecir eventos raros. Mejorar la calidad de los datos de entrenamiento es una forma común de mejorar el rendimiento de los algoritmos. Sin embargo, hay poca investigación sobre cómo seleccionar datos de entrenamiento de manera cuantitativa. En este estudio, se propone un método de selección de datos de entrenamiento para mejorar el rendimiento de los modelos de aprendizaje profundo. El método propuesto puede representar diferentes series temporales multivariadas de longitud temporal divididas por variables categóricas y medir las (dis)similitudes mediante la matriz de distancia y el método de agrupamiento. Las contribuciones son: (1) El método propuesto puede encontrar los cambios en los datos de entrenamiento causados por variables categóricas en un conjunto de datos de series temporales multivariadas; (2) según el método propuesto, los datos de series temporales multivariadas de la línea de producción pueden agruparse en muchos conjuntos de datos de entrenamiento pequeños; y (3) se construyen modelos de predicción con la misma estructura pero diferentes parámetros en lugar de un modelo, lo cual es diferente del enfoque tradicional. En la práctica, el método propuesto se aplica en un conjunto de datos real de múltiples líneas de producción de productos y los resultados muestran que no solo puede mejorar significativamente el rendimiento del modelo de reconstrucción, sino que también puede medir de manera cuantitativa las (dis)similitudes de los comportamientos de producción.
Descripción
Los fabricantes están luchando por utilizar datos de múltiples líneas de producción de productos para predecir eventos raros. Mejorar la calidad de los datos de entrenamiento es una forma común de mejorar el rendimiento de los algoritmos. Sin embargo, hay poca investigación sobre cómo seleccionar datos de entrenamiento de manera cuantitativa. En este estudio, se propone un método de selección de datos de entrenamiento para mejorar el rendimiento de los modelos de aprendizaje profundo. El método propuesto puede representar diferentes series temporales multivariadas de longitud temporal divididas por variables categóricas y medir las (dis)similitudes mediante la matriz de distancia y el método de agrupamiento. Las contribuciones son: (1) El método propuesto puede encontrar los cambios en los datos de entrenamiento causados por variables categóricas en un conjunto de datos de series temporales multivariadas; (2) según el método propuesto, los datos de series temporales multivariadas de la línea de producción pueden agruparse en muchos conjuntos de datos de entrenamiento pequeños; y (3) se construyen modelos de predicción con la misma estructura pero diferentes parámetros en lugar de un modelo, lo cual es diferente del enfoque tradicional. En la práctica, el método propuesto se aplica en un conjunto de datos real de múltiples líneas de producción de productos y los resultados muestran que no solo puede mejorar significativamente el rendimiento del modelo de reconstrucción, sino que también puede medir de manera cuantitativa las (dis)similitudes de los comportamientos de producción.