Cadena de suministro adaptativa: sincronización de demanda y suministro utilizando aprendizaje profundo por refuerzo
Autores: Kegenbekov, Zhandos; Jackson, Ilya
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Cadena de suministro adaptativa: sincronización de demanda y suministro utilizando aprendizaje profundo por refuerzo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Cadenas de suministro
Agente de aprendizaje profundo por refuerzo
Algoritmo de optimización de políticas proximales
Continuidad del negocio
Visibilidad de extremo a extremo
Control adaptativo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
Las cadenas de suministro adaptativas y altamente sincronizadas pueden evitar una dinámica de inventario de subida y caída en cascada y mitigar los efectos en cadena causados por fallas operativas. Este documento tiene como objetivo demostrar cómo un agente de aprendizaje profundo por refuerzo basado en el algoritmo de optimización de política proximal puede sincronizar los flujos de entrada y salida y apoyar la continuidad del negocio operando en un entorno estocástico y no estacionario si se proporciona visibilidad de extremo a extremo. El agente de aprendizaje profundo por refuerzo se basa en el algoritmo de optimización de política proximal, que no requiere un espacio de acción codificado y una sintonización exhaustiva de hiperparámetros. Estas características, complementadas con un entorno de cadena de suministro sencillo, dan lugar a un enfoque general y no específico de la tarea para el control adaptativo en cadenas de suministro de múltiples niveles. El enfoque propuesto se compara con la política de stock base, un método conocido en la investigación de operaciones clásicas y la teoría del control de inventario. La política de stock base es prevalente en los sistemas de inventario de revisión continua. El documento concluye con la afirmación de que la solución propuesta puede realizar un control adaptativo en cadenas de suministro complejas. El documento también postula gemelos digitales de cadenas de suministro completamente desarrollados como una condición infraestructural necesaria para aplicaciones del mundo real escalables.
Descripción
Las cadenas de suministro adaptativas y altamente sincronizadas pueden evitar una dinámica de inventario de subida y caída en cascada y mitigar los efectos en cadena causados por fallas operativas. Este documento tiene como objetivo demostrar cómo un agente de aprendizaje profundo por refuerzo basado en el algoritmo de optimización de política proximal puede sincronizar los flujos de entrada y salida y apoyar la continuidad del negocio operando en un entorno estocástico y no estacionario si se proporciona visibilidad de extremo a extremo. El agente de aprendizaje profundo por refuerzo se basa en el algoritmo de optimización de política proximal, que no requiere un espacio de acción codificado y una sintonización exhaustiva de hiperparámetros. Estas características, complementadas con un entorno de cadena de suministro sencillo, dan lugar a un enfoque general y no específico de la tarea para el control adaptativo en cadenas de suministro de múltiples niveles. El enfoque propuesto se compara con la política de stock base, un método conocido en la investigación de operaciones clásicas y la teoría del control de inventario. La política de stock base es prevalente en los sistemas de inventario de revisión continua. El documento concluye con la afirmación de que la solución propuesta puede realizar un control adaptativo en cadenas de suministro complejas. El documento también postula gemelos digitales de cadenas de suministro completamente desarrollados como una condición infraestructural necesaria para aplicaciones del mundo real escalables.