Investigación sobre un Método de Programación en Tiempo Real Adaptativo para Talleres de Trabajo Dinámicos Basado en Aprendizaje por Refuerzo

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Investigación sobre un Método de Programación en Tiempo Real Adaptativo para Talleres de Trabajo Dinámicos Basado en Aprendizaje por Refuerzo

Autores: Zhu, Haihua; Tao, Shuai; Gui, Yong; Cai, Qixiang

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico

2022

Investigación sobre un Método de Programación en Tiempo Real Adaptativo para Talleres de Trabajo Dinámicos Basado en Aprendizaje por Refuerzo

Categoría

Tecnología de Equipos y Accesorios

Subcategoría

Diseño de equipos y herramientas

Palabras clave

Desarrollo

Niveles de vida

Requisitos del mercado

Empresas manufactureras

Método de programación

Aprendizaje por refuerzo

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 16

Citaciones: Sin citaciones

Con el rápido desarrollo de la industrialización moderna en nuestro país y la mejora continua de los estándares de vida de las personas, el mercado cambiante ha planteado nuevas exigencias para las empresas manufactureras tradicionales. La demanda de productos por pedido de muchas empresas manufactureras está cambiando de una variedad única y grandes lotes a múltiples variedades y pequeños lotes. Ante este cambio, el método tradicional de programación de talleres es insuficiente, lo que afecta en gran medida la eficiencia del taller de producción. Para resolver los problemas mencionados, este documento propone un método de programación en tiempo real basado en el aprendizaje por refuerzo aplicado en el taller dinámico y, al mismo tiempo, se diseña un nuevo tipo de red neuronal. La red neuronal se diseña con los datos de alta dimensión del problema mencionado como entrada, y se propone un algoritmo de aprendizaje por refuerzo basado en políticas basado en esta red. En el proceso de investigación, se encontró que el método de aprendizaje por refuerzo no solo permite al agente utilizar datos históricos para aprender, sino que también le permite explorar y aprender otras posibles acciones de alta recompensa dentro de un cierto rango, para así realizar la optimización de los objetivos de producción bajo programación en tiempo real. La efectividad del método de programación en tiempo real propuesto se verifica comparándolo con otros métodos de programación basados en reglas comunes en el entorno de fabricación.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro