Investigación sobre un Método de Programación en Tiempo Real Adaptativo para Talleres de Trabajo Dinámicos Basado en Aprendizaje por Refuerzo
Autores: Zhu, Haihua; Tao, Shuai; Gui, Yong; Cai, Qixiang
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Investigación sobre un Método de Programación en Tiempo Real Adaptativo para Talleres de Trabajo Dinámicos Basado en Aprendizaje por Refuerzo
Categoría
Tecnología de Equipos y Accesorios
Subcategoría
Diseño de equipos y herramientas
Palabras clave
Desarrollo
Niveles de vida
Requisitos del mercado
Empresas manufactureras
Método de programación
Aprendizaje por refuerzo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 16
Citaciones: Sin citaciones
Con el rápido desarrollo de la industrialización moderna en nuestro país y la mejora continua de los estándares de vida de las personas, el mercado cambiante ha planteado nuevas exigencias para las empresas manufactureras tradicionales. La demanda de productos por pedido de muchas empresas manufactureras está cambiando de una variedad única y grandes lotes a múltiples variedades y pequeños lotes. Ante este cambio, el método tradicional de programación de talleres es insuficiente, lo que afecta en gran medida la eficiencia del taller de producción. Para resolver los problemas mencionados, este documento propone un método de programación en tiempo real basado en el aprendizaje por refuerzo aplicado en el taller dinámico y, al mismo tiempo, se diseña un nuevo tipo de red neuronal. La red neuronal se diseña con los datos de alta dimensión del problema mencionado como entrada, y se propone un algoritmo de aprendizaje por refuerzo basado en políticas basado en esta red. En el proceso de investigación, se encontró que el método de aprendizaje por refuerzo no solo permite al agente utilizar datos históricos para aprender, sino que también le permite explorar y aprender otras posibles acciones de alta recompensa dentro de un cierto rango, para así realizar la optimización de los objetivos de producción bajo programación en tiempo real. La efectividad del método de programación en tiempo real propuesto se verifica comparándolo con otros métodos de programación basados en reglas comunes en el entorno de fabricación.
Descripción
Con el rápido desarrollo de la industrialización moderna en nuestro país y la mejora continua de los estándares de vida de las personas, el mercado cambiante ha planteado nuevas exigencias para las empresas manufactureras tradicionales. La demanda de productos por pedido de muchas empresas manufactureras está cambiando de una variedad única y grandes lotes a múltiples variedades y pequeños lotes. Ante este cambio, el método tradicional de programación de talleres es insuficiente, lo que afecta en gran medida la eficiencia del taller de producción. Para resolver los problemas mencionados, este documento propone un método de programación en tiempo real basado en el aprendizaje por refuerzo aplicado en el taller dinámico y, al mismo tiempo, se diseña un nuevo tipo de red neuronal. La red neuronal se diseña con los datos de alta dimensión del problema mencionado como entrada, y se propone un algoritmo de aprendizaje por refuerzo basado en políticas basado en esta red. En el proceso de investigación, se encontró que el método de aprendizaje por refuerzo no solo permite al agente utilizar datos históricos para aprender, sino que también le permite explorar y aprender otras posibles acciones de alta recompensa dentro de un cierto rango, para así realizar la optimización de los objetivos de producción bajo programación en tiempo real. La efectividad del método de programación en tiempo real propuesto se verifica comparándolo con otros métodos de programación basados en reglas comunes en el entorno de fabricación.