Modelo de lenguaje grande asistido por aprendizaje por refuerzo para el problema de la línea de desmontaje híbrida

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Modelo de lenguaje grande asistido por aprendizaje por refuerzo para el problema de la línea de desmontaje híbrida

Autores: Guo, Xiwang; Jiao, Chi; Ji, Peng; Wang, Jiacun; Qin, Shujin; Hu, Bin; Qi, Liang; Lang, Xianming

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Modelo de lenguaje grande asistido por aprendizaje por refuerzo para el problema de la línea de desmontaje híbrida

Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Reciclaje

Remanufactura

Problema de equilibrio de la línea de desmontaje

Posturas de los trabajadores

Línea de desmontaje híbrida

Modelo de lenguaje grande

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 22

Citaciones: Sin citaciones

El reciclaje de productos al final de su vida útil es esencial para reducir el impacto ambiental y promover la reutilización de recursos. En el ámbito de la remanufactura, los investigadores se están concentrando cada vez más en el desafío del problema de equilibrio de la línea de desmontaje (DLBP), especialmente en cómo asignar tareas de trabajo de manera efectiva para mejorar la productividad. Sin embargo, muchos estudios actuales pasan por alto dos problemas clave: (1) cómo organizar razonablemente la postura de los trabajadores durante el desmontaje, y (2) cómo organizar de manera razonable las tareas de desmontaje cuando el entorno de desmontaje no es una sola línea de desmontaje, sino una línea de desmontaje híbrida. Para abordar estos problemas, proponemos un modelo de programación mixto integrado adecuado para líneas de desmontaje híbridas lineales y en forma de U, teniendo en cuenta también cómo asignar razonablemente posturas de trabajadores para aliviar la fatiga de los trabajadores. Además, introducimos el aprendizaje por refuerzo asistido por un gran modelo de lenguaje para resolver este modelo, que emplea una Red Q profunda de Duelo (Duel-DQN) para abordar el problema e integra un gran modelo de lenguaje (LLM) en el algoritmo. Los resultados experimentales muestran que en comparación con las soluciones que solo utilizan aprendizaje por refuerzo, el aprendizaje por refuerzo asistido por un gran modelo de lenguaje reduce el número de iteraciones requeridas para la convergencia en aproximadamente un 50%, asegurando al mismo tiempo la calidad de las soluciones. Esto proporciona nuevas perspectivas sobre la aplicación de LLM en el aprendizaje por refuerzo y DLBP.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro