Diseño e Implementación de un Sistema de Programación Basado en Simulación con Aprendizaje por Refuerzo para Líneas de Producción Re-Entrantes
Autores: Jeon, Seung-Woo; Lee, Donggun; Oh, Seog-Chan; Park, Kyu-Tae; Noh, Sang-Do; Arinez, Jorge
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Diseño e Implementación de un Sistema de Programación Basado en Simulación con Aprendizaje por Refuerzo para Líneas de Producción Re-Entrantes
Categoría
Tecnología de Equipos y Accesorios
Subcategoría
Diseño de equipos y herramientas
Palabras clave
Empresas manufactureras
Utilización de recursos
Líneas de producción
Producción reentrante
Sistema de programación
Aprendizaje profundo por refuerzo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 16
Citaciones: Sin citaciones
Recientemente, las empresas manufactureras han estado haciendo esfuerzos para aumentar la utilización de recursos mientras aseguran la flexibilidad de las líneas de producción para responder a entornos de mercado y demandas de clientes que cambian rápidamente. En la industria de fabricación de alta tecnología, que requiere instalaciones de fabricación costosas y es intensiva en capital, se utilizan líneas de producción reentrantes para una producción eficiente con recursos limitados. En dicho sistema de producción, una pieza visita una estación específica repetidamente durante el período de producción. Sin embargo, una línea de producción reentrante requiere un sistema de programación adecuado porque otras piezas con diferentes requisitos de procesamiento se procesan en la misma estación. En este estudio, se modeló una línea de producción reentrante como un entorno de fabricación a través de simulación, y se desarrolló un sistema de programación adaptativa para mejorar su rendimiento operativo aplicando aprendizaje por refuerzo profundo (DRL). Para lograr esto, se desarrolló una arquitectura de software para integrar DRL con la simulación y se definieron los estados, acciones y recompensas del agente de aprendizaje por refuerzo (RL). Además, se diseñó un módulo de control de simulación de eventos discretos para recopilar datos del modelo de simulación y evaluar la red de políticas entrenada a través de DRL. Finalmente, se verificó la aplicabilidad y efectividad del sistema de programación desarrollado mediante la realización de experimentos en una línea de producción reentrante hipotética.
Descripción
Recientemente, las empresas manufactureras han estado haciendo esfuerzos para aumentar la utilización de recursos mientras aseguran la flexibilidad de las líneas de producción para responder a entornos de mercado y demandas de clientes que cambian rápidamente. En la industria de fabricación de alta tecnología, que requiere instalaciones de fabricación costosas y es intensiva en capital, se utilizan líneas de producción reentrantes para una producción eficiente con recursos limitados. En dicho sistema de producción, una pieza visita una estación específica repetidamente durante el período de producción. Sin embargo, una línea de producción reentrante requiere un sistema de programación adecuado porque otras piezas con diferentes requisitos de procesamiento se procesan en la misma estación. En este estudio, se modeló una línea de producción reentrante como un entorno de fabricación a través de simulación, y se desarrolló un sistema de programación adaptativa para mejorar su rendimiento operativo aplicando aprendizaje por refuerzo profundo (DRL). Para lograr esto, se desarrolló una arquitectura de software para integrar DRL con la simulación y se definieron los estados, acciones y recompensas del agente de aprendizaje por refuerzo (RL). Además, se diseñó un módulo de control de simulación de eventos discretos para recopilar datos del modelo de simulación y evaluar la red de políticas entrenada a través de DRL. Finalmente, se verificó la aplicabilidad y efectividad del sistema de programación desarrollado mediante la realización de experimentos en una línea de producción reentrante hipotética.