Algoritmo de Ventaja Actor-Crítico Multi-Objetivo para el Balanceo de Líneas de Desensamblaje Híbridas con Trabajadores Multi-Habilidosos
Autores: Wang, Jiacun; Xi, Guipeng; Guo, Xiwang; Qin, Shujin; Han, Henry
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Algoritmo de Ventaja Actor-Crítico Multi-Objetivo para el Balanceo de Líneas de Desensamblaje Híbridas con Trabajadores Multi-Habilidosos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Programación
Líneas de desensamblaje
Híbrido
Trabajadores polivalentes
Beneficio
Emisiones de carbono
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La programación de líneas de desensamblaje es de gran importancia para lograr una productividad optimizada. En este documento, abordamos el Problema de Balanceo de Líneas de Desensamblaje Híbridas que combina líneas de desensamblaje lineales y líneas de desensamblaje en forma de U, considerando trabajadores multi-hábiles y enfocándonos en el beneficio y las emisiones de carbono. A diferencia de los enfoques comunes en el aprendizaje por refuerzo que típicamente emplean estrategias de ponderación para resolver problemas multi-objetivo, nuestro enfoque incorpora de manera innovadora el ranking no dominado directamente en la función de recompensa. La exploración de soluciones en la frontera de Pareto o mejores soluciones se modera comparando el rendimiento entre soluciones y ajustando dinámicamente las recompensas en función de la ocurrencia de soluciones repetidas. Los resultados experimentales muestran que el algoritmo multi-objetivo Advantage Actor-Critic basado en la optimización de Pareto exhibe un rendimiento superior en términos de superioridad de métricas en la comparación de seis casos experimentales de diferentes escalas, con una excelente tasa de comparación de métricas del 70%. En algunos de los casos experimentales en este documento, las soluciones producidas por el algoritmo multi-objetivo Advantage Actor-Critic muestran algunas ventajas sobre otros algoritmos populares como el Algoritmo de Gradiente de Política Determinista Profunda, el Algoritmo de Actor-Critic Suave y el Algoritmo Genético de Clasificación No Dominada II. Esto corrobora aún más la efectividad de nuestra solución propuesta.
Descripción
La programación de líneas de desensamblaje es de gran importancia para lograr una productividad optimizada. En este documento, abordamos el Problema de Balanceo de Líneas de Desensamblaje Híbridas que combina líneas de desensamblaje lineales y líneas de desensamblaje en forma de U, considerando trabajadores multi-hábiles y enfocándonos en el beneficio y las emisiones de carbono. A diferencia de los enfoques comunes en el aprendizaje por refuerzo que típicamente emplean estrategias de ponderación para resolver problemas multi-objetivo, nuestro enfoque incorpora de manera innovadora el ranking no dominado directamente en la función de recompensa. La exploración de soluciones en la frontera de Pareto o mejores soluciones se modera comparando el rendimiento entre soluciones y ajustando dinámicamente las recompensas en función de la ocurrencia de soluciones repetidas. Los resultados experimentales muestran que el algoritmo multi-objetivo Advantage Actor-Critic basado en la optimización de Pareto exhibe un rendimiento superior en términos de superioridad de métricas en la comparación de seis casos experimentales de diferentes escalas, con una excelente tasa de comparación de métricas del 70%. En algunos de los casos experimentales en este documento, las soluciones producidas por el algoritmo multi-objetivo Advantage Actor-Critic muestran algunas ventajas sobre otros algoritmos populares como el Algoritmo de Gradiente de Política Determinista Profunda, el Algoritmo de Actor-Critic Suave y el Algoritmo Genético de Clasificación No Dominada II. Esto corrobora aún más la efectividad de nuestra solución propuesta.