Resolviendo problemas de corte de stock unidimensional con el aprendizaje profundo por refuerzo
Autores: Fang, Jie; Rao, Yunqing; Luo, Qiang; Xu, Jiatai
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Resolviendo problemas de corte de stock unidimensional con el aprendizaje profundo por refuerzo
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Problema de corte unidimensional
Problema de optimización combinatoria
Algoritmos genéticos
Problema de corte
Aprendizaje profundo por refuerzo
Modelo matemático
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 18
Citaciones: Sin citaciones
Es bien sabido que el problema de corte unidimensional (1DCSP) es un problema de optimización combinatoria con características polinomiales no determinísticas (NP-hard). Los algoritmos heurísticos y genéticos son los dos principales algoritmos utilizados para resolver el problema de corte (CSP), que tiene problemas de escala pequeña y soluciones de baja eficiencia. Para mejorar mejor la estabilidad y versatilidad de la solución, se establece un modelo matemático, con el objetivo de optimización del consumo mínimo de materia prima y la longitud máxima de material restante. Mientras tanto, en este documento se propone un nuevo algoritmo basado en aprendizaje profundo por refuerzo (DRL). El algoritmo consta de dos módulos, cada uno diseñado para funciones diferentes. En primer lugar, se utiliza la red de punteros con estructura de codificador y decodificador como red de políticas para utilizar el modo subyacente compartido por el 1DCSP. En segundo lugar, se utiliza el algoritmo de aprendizaje por refuerzo sin modelo para entrenar los parámetros de la red y optimizar la secuencia de corte. Los datos experimentales muestran que el modelo de algoritmo de corte unidimensional basado en aprendizaje profundo por refuerzo (DRL-CSP) puede obtener la solución satisfactoria aproximada en 82 instancias de 3 conjuntos de datos en muy poco tiempo, y muestra un buen rendimiento de generalización y potencial de aplicación práctica.
Descripción
Es bien sabido que el problema de corte unidimensional (1DCSP) es un problema de optimización combinatoria con características polinomiales no determinísticas (NP-hard). Los algoritmos heurísticos y genéticos son los dos principales algoritmos utilizados para resolver el problema de corte (CSP), que tiene problemas de escala pequeña y soluciones de baja eficiencia. Para mejorar mejor la estabilidad y versatilidad de la solución, se establece un modelo matemático, con el objetivo de optimización del consumo mínimo de materia prima y la longitud máxima de material restante. Mientras tanto, en este documento se propone un nuevo algoritmo basado en aprendizaje profundo por refuerzo (DRL). El algoritmo consta de dos módulos, cada uno diseñado para funciones diferentes. En primer lugar, se utiliza la red de punteros con estructura de codificador y decodificador como red de políticas para utilizar el modo subyacente compartido por el 1DCSP. En segundo lugar, se utiliza el algoritmo de aprendizaje por refuerzo sin modelo para entrenar los parámetros de la red y optimizar la secuencia de corte. Los datos experimentales muestran que el modelo de algoritmo de corte unidimensional basado en aprendizaje profundo por refuerzo (DRL-CSP) puede obtener la solución satisfactoria aproximada en 82 instancias de 3 conjuntos de datos en muy poco tiempo, y muestra un buen rendimiento de generalización y potencial de aplicación práctica.