Modelo de lenguaje grande asistido por aprendizaje por refuerzo para el problema de la línea de desmontaje híbrida
Autores: Guo, Xiwang; Jiao, Chi; Ji, Peng; Wang, Jiacun; Qin, Shujin; Hu, Bin; Qi, Liang; Lang, Xianming
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Modelo de lenguaje grande asistido por aprendizaje por refuerzo para el problema de la línea de desmontaje híbrida
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Reciclaje
Remanufactura
Problema de equilibrio de la línea de desmontaje
Posturas de los trabajadores
Línea de desmontaje híbrida
Modelo de lenguaje grande
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
El reciclaje de productos al final de su vida útil es esencial para reducir el impacto ambiental y promover la reutilización de recursos. En el ámbito de la remanufactura, los investigadores se están concentrando cada vez más en el desafío del problema de equilibrio de la línea de desmontaje (DLBP), especialmente en cómo asignar tareas de trabajo de manera efectiva para mejorar la productividad. Sin embargo, muchos estudios actuales pasan por alto dos problemas clave: (1) cómo organizar razonablemente la postura de los trabajadores durante el desmontaje, y (2) cómo organizar de manera razonable las tareas de desmontaje cuando el entorno de desmontaje no es una sola línea de desmontaje, sino una línea de desmontaje híbrida. Para abordar estos problemas, proponemos un modelo de programación mixto integrado adecuado para líneas de desmontaje híbridas lineales y en forma de U, teniendo en cuenta también cómo asignar razonablemente posturas de trabajadores para aliviar la fatiga de los trabajadores. Además, introducimos el aprendizaje por refuerzo asistido por un gran modelo de lenguaje para resolver este modelo, que emplea una Red Q profunda de Duelo (Duel-DQN) para abordar el problema e integra un gran modelo de lenguaje (LLM) en el algoritmo. Los resultados experimentales muestran que en comparación con las soluciones que solo utilizan aprendizaje por refuerzo, el aprendizaje por refuerzo asistido por un gran modelo de lenguaje reduce el número de iteraciones requeridas para la convergencia en aproximadamente un 50%, asegurando al mismo tiempo la calidad de las soluciones. Esto proporciona nuevas perspectivas sobre la aplicación de LLM en el aprendizaje por refuerzo y DLBP.
Descripción
El reciclaje de productos al final de su vida útil es esencial para reducir el impacto ambiental y promover la reutilización de recursos. En el ámbito de la remanufactura, los investigadores se están concentrando cada vez más en el desafío del problema de equilibrio de la línea de desmontaje (DLBP), especialmente en cómo asignar tareas de trabajo de manera efectiva para mejorar la productividad. Sin embargo, muchos estudios actuales pasan por alto dos problemas clave: (1) cómo organizar razonablemente la postura de los trabajadores durante el desmontaje, y (2) cómo organizar de manera razonable las tareas de desmontaje cuando el entorno de desmontaje no es una sola línea de desmontaje, sino una línea de desmontaje híbrida. Para abordar estos problemas, proponemos un modelo de programación mixto integrado adecuado para líneas de desmontaje híbridas lineales y en forma de U, teniendo en cuenta también cómo asignar razonablemente posturas de trabajadores para aliviar la fatiga de los trabajadores. Además, introducimos el aprendizaje por refuerzo asistido por un gran modelo de lenguaje para resolver este modelo, que emplea una Red Q profunda de Duelo (Duel-DQN) para abordar el problema e integra un gran modelo de lenguaje (LLM) en el algoritmo. Los resultados experimentales muestran que en comparación con las soluciones que solo utilizan aprendizaje por refuerzo, el aprendizaje por refuerzo asistido por un gran modelo de lenguaje reduce el número de iteraciones requeridas para la convergencia en aproximadamente un 50%, asegurando al mismo tiempo la calidad de las soluciones. Esto proporciona nuevas perspectivas sobre la aplicación de LLM en el aprendizaje por refuerzo y DLBP.