logo móvil
Contáctanos

Modelo de lenguaje grande asistido por aprendizaje por refuerzo para el problema de la línea de desmontaje híbrida

Autores: Guo, Xiwang; Jiao, Chi; Ji, Peng; Wang, Jiacun; Qin, Shujin; Hu, Bin; Qi, Liang; Lang, Xianming

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Modelo de lenguaje grande asistido por aprendizaje por refuerzo para el problema de la línea de desmontaje híbrida


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Reciclaje
Remanufactura
Problema de equilibrio de la línea de desmontaje
Posturas de los trabajadores
Línea de desmontaje híbrida
Modelo de lenguaje grande

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 22

Citaciones: Sin citaciones


Descripción
El reciclaje de productos al final de su vida útil es esencial para reducir el impacto ambiental y promover la reutilización de recursos. En el ámbito de la remanufactura, los investigadores se están concentrando cada vez más en el desafío del problema de equilibrio de la línea de desmontaje (DLBP), especialmente en cómo asignar tareas de trabajo de manera efectiva para mejorar la productividad. Sin embargo, muchos estudios actuales pasan por alto dos problemas clave: (1) cómo organizar razonablemente la postura de los trabajadores durante el desmontaje, y (2) cómo organizar de manera razonable las tareas de desmontaje cuando el entorno de desmontaje no es una sola línea de desmontaje, sino una línea de desmontaje híbrida. Para abordar estos problemas, proponemos un modelo de programación mixto integrado adecuado para líneas de desmontaje híbridas lineales y en forma de U, teniendo en cuenta también cómo asignar razonablemente posturas de trabajadores para aliviar la fatiga de los trabajadores. Además, introducimos el aprendizaje por refuerzo asistido por un gran modelo de lenguaje para resolver este modelo, que emplea una Red Q profunda de Duelo (Duel-DQN) para abordar el problema e integra un gran modelo de lenguaje (LLM) en el algoritmo. Los resultados experimentales muestran que en comparación con las soluciones que solo utilizan aprendizaje por refuerzo, el aprendizaje por refuerzo asistido por un gran modelo de lenguaje reduce el número de iteraciones requeridas para la convergencia en aproximadamente un 50%, asegurando al mismo tiempo la calidad de las soluciones. Esto proporciona nuevas perspectivas sobre la aplicación de LLM en el aprendizaje por refuerzo y DLBP.

Otros recursos que podrían interesarte

Temas Virtualpro