Un algoritmo actor-critic de ventaja optimizado para el problema de equilibrio de líneas de desmontaje considerando la degradación de herramientas de desmontaje
Autores: Qin, Shujin; Xie, Xinkai; Wang, Jiacun; Guo, Xiwang; Qi, Liang; Cai, Weibiao; Tang, Ying; Talukder, Qurra Tul Ann
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un algoritmo actor-critic de ventaja optimizado para el problema de equilibrio de líneas de desmontaje considerando la degradación de herramientas de desmontaje
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Preservación ecológica
Conservación de recursos naturales
Reciclaje de recursos
Herramientas de desmontaje
Modelo matemático
Aprendizaje por refuerzo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 38
Citaciones: Sin citaciones
El creciente énfasis en la preservación ecológica y la conservación de recursos naturales ha avanzado significativamente el reciclaje de recursos, facilitando la realización de una economía verde sostenible. Esencial para el reciclaje de recursos es la etapa crucial de desmontaje, donde la eficacia de las herramientas de desmontaje juega un papel crítico. Este trabajo investiga el impacto de las herramientas de desmontaje en la duración del desmontaje y formula un modelo matemático con el objetivo de minimizar el tiempo del ciclo de la estación de trabajo. Para resolver este modelo, empleamos un algoritmo de actor-critic de ventaja optimizado dentro del aprendizaje por refuerzo. Además, utiliza el solver CPLEX para validar la precisión del modelo. Los resultados experimentales obtenidos de CPLEX no solo confirman la viabilidad del algoritmo, sino que también permiten un análisis comparativo contra tanto el algoritmo original de actor-critic de ventaja como el algoritmo de actor-critic. Este trabajo comparativo verifica la superioridad del algoritmo propuesto.
Descripción
El creciente énfasis en la preservación ecológica y la conservación de recursos naturales ha avanzado significativamente el reciclaje de recursos, facilitando la realización de una economía verde sostenible. Esencial para el reciclaje de recursos es la etapa crucial de desmontaje, donde la eficacia de las herramientas de desmontaje juega un papel crítico. Este trabajo investiga el impacto de las herramientas de desmontaje en la duración del desmontaje y formula un modelo matemático con el objetivo de minimizar el tiempo del ciclo de la estación de trabajo. Para resolver este modelo, empleamos un algoritmo de actor-critic de ventaja optimizado dentro del aprendizaje por refuerzo. Además, utiliza el solver CPLEX para validar la precisión del modelo. Los resultados experimentales obtenidos de CPLEX no solo confirman la viabilidad del algoritmo, sino que también permiten un análisis comparativo contra tanto el algoritmo original de actor-critic de ventaja como el algoritmo de actor-critic. Este trabajo comparativo verifica la superioridad del algoritmo propuesto.