Multi-AGV programación dinámica en un terminal de contenedores automatizado: un enfoque de aprendizaje profundo por refuerzo
Autores: Zheng, Xiyan; Liang, Chengji; Wang, Yu; Shi, Jian; Lim, Gino
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Multi-AGV programación dinámica en un terminal de contenedores automatizado: un enfoque de aprendizaje profundo por refuerzo
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Desarrollo
Comercio global
Puertos
Terminales
Vehículos guiados automáticos
AGVs
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
Con el rápido desarrollo del comercio global, los puertos y terminales están desempeñando un papel cada vez más importante, y los vehículos guiados automáticos (AGVs) se han utilizado como los principales transportadores que realizan las operaciones de carga/descarga en terminales de contenedores automatizados. En este documento, investigamos un problema de programación dinámica de múltiples AGV para mejorar la eficiencia operativa del terminal, considerando la complejidad sofisticada e incertidumbre involucradas en la operación del terminal portuario. Proponemos modelar la programación dinámica de AGVs como un proceso de decisión de Markov (MDP) con reglas de decisión mixtas. Luego, desarrollamos un nuevo algoritmo de aprendizaje adaptativo basado en una red Q profunda (DQN) para generar la política óptima. El algoritmo propuesto se entrena en base a datos obtenidos de interacciones con un entorno de simulación que refleja la operación del mundo real de un terminal automatizado en Shanghai, China. Los estudios de simulación muestran que, en comparación con los métodos de programación convencionales que utilizan un algoritmo heurístico, es decir, algoritmo genético (GA) y programación basada en reglas, el enfoque propuesto del terminal tiene un mejor rendimiento en términos de efectividad y eficiencia.
Descripción
Con el rápido desarrollo del comercio global, los puertos y terminales están desempeñando un papel cada vez más importante, y los vehículos guiados automáticos (AGVs) se han utilizado como los principales transportadores que realizan las operaciones de carga/descarga en terminales de contenedores automatizados. En este documento, investigamos un problema de programación dinámica de múltiples AGV para mejorar la eficiencia operativa del terminal, considerando la complejidad sofisticada e incertidumbre involucradas en la operación del terminal portuario. Proponemos modelar la programación dinámica de AGVs como un proceso de decisión de Markov (MDP) con reglas de decisión mixtas. Luego, desarrollamos un nuevo algoritmo de aprendizaje adaptativo basado en una red Q profunda (DQN) para generar la política óptima. El algoritmo propuesto se entrena en base a datos obtenidos de interacciones con un entorno de simulación que refleja la operación del mundo real de un terminal automatizado en Shanghai, China. Los estudios de simulación muestran que, en comparación con los métodos de programación convencionales que utilizan un algoritmo heurístico, es decir, algoritmo genético (GA) y programación basada en reglas, el enfoque propuesto del terminal tiene un mejor rendimiento en términos de efectividad y eficiencia.