Control de Temperatura para el Colocación Automática de Cinta con Calentadores Infrarrojos Basado en Aprendizaje por Refuerzo
Autores: Römer, Martin; Bergers, Johannes; Gabriel, Felix; Dröder, Klaus
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Control de Temperatura para el Colocación Automática de Cinta con Calentadores Infrarrojos Basado en Aprendizaje por Refuerzo
Categoría
Tecnología de Equipos y Accesorios
Subcategoría
Diseño de equipos y herramientas
Palabras clave
Materiales ligeros reforzados con fibra
Electromovilidad
Colocación automatizada de cintas
Sistema de control de temperatura
Aprendizaje por refuerzo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 16
Citaciones: Sin citaciones
El uso de materiales ligeros reforzados con fibra en el campo de la electromovilidad ofrece grandes oportunidades para aumentar la autonomía de los vehículos eléctricos y también mejorar la funcionalidad de los propios componentes. Para satisfacer la demanda de un alto número de variantes, se requieren tecnologías de producción flexibles que puedan adaptarse rápidamente a diferentes variantes de componentes y así evitar largos tiempos de configuración del equipo de producción necesario. Al aplicar el proceso flexible de colocación automática de cintas (ATL), es posible construir componentes ligeros de manera flexible en variantes. Las cintas unidireccionales (UD) se utilizan a menudo para construir estructuras ligeras de acuerdo con un camino de carga predefinido. Sin embargo, la cinta UD que se utiliza para construir los componentes es particularmente sensible a las fluctuaciones de temperatura debido a su bajo grosor. Las fluctuaciones de temperatura dentro de los sitios de producción, así como el calentamiento de la capa de cinta y la superficie de depósito durante tiempos de proceso más largos, tienen un impacto en el flujo de calor que se infunde a la cinta y hacen que un control adaptativo del calentamiento de la cinta sea indispensable. En la actualidad, existen varias estrategias de control basadas en modelos. Sin embargo, estas estrategias requieren una comprensión integral del sistema ATL y su entorno, y por lo tanto son difíciles de diseñar. Con la posibilidad de aprendizaje por refuerzo sin modelo, es posible construir un sistema de control de temperatura que aprenda las dependencias comunes tanto del proceso utilizado como de su entorno operativo, sin necesidad de depender de una comprensión completa de las interrelaciones físicas. En este documento, se presenta un enfoque de aprendizaje por refuerzo basado en el algoritmo de gradiente de política determinista profundo (DDPG), con el objetivo de controlar la temperatura de un efector final ATL basado en emisores infrarrojos. El algoritmo fue adaptado a la inercia térmica del sistema y entrenado en un entorno de proceso real. Con solo una pequeña cantidad de datos de entrenamiento, el agente DDPG entrenado pudo mantener de manera confiable las temperaturas del proceso ATL dentro de un rango de tolerancia especificado. Al aplicar esta técnica, la cinta UD se puede depositar a una temperatura de proceso constante durante tiempos de proceso más largos sin necesidad de un sistema de enfriamiento. Reducir la complejidad del proceso puede ayudar a aumentar la prevalencia de componentes ligeros y, por lo tanto, contribuir a un menor consumo de energía de los vehículos eléctricos.
Descripción
El uso de materiales ligeros reforzados con fibra en el campo de la electromovilidad ofrece grandes oportunidades para aumentar la autonomía de los vehículos eléctricos y también mejorar la funcionalidad de los propios componentes. Para satisfacer la demanda de un alto número de variantes, se requieren tecnologías de producción flexibles que puedan adaptarse rápidamente a diferentes variantes de componentes y así evitar largos tiempos de configuración del equipo de producción necesario. Al aplicar el proceso flexible de colocación automática de cintas (ATL), es posible construir componentes ligeros de manera flexible en variantes. Las cintas unidireccionales (UD) se utilizan a menudo para construir estructuras ligeras de acuerdo con un camino de carga predefinido. Sin embargo, la cinta UD que se utiliza para construir los componentes es particularmente sensible a las fluctuaciones de temperatura debido a su bajo grosor. Las fluctuaciones de temperatura dentro de los sitios de producción, así como el calentamiento de la capa de cinta y la superficie de depósito durante tiempos de proceso más largos, tienen un impacto en el flujo de calor que se infunde a la cinta y hacen que un control adaptativo del calentamiento de la cinta sea indispensable. En la actualidad, existen varias estrategias de control basadas en modelos. Sin embargo, estas estrategias requieren una comprensión integral del sistema ATL y su entorno, y por lo tanto son difíciles de diseñar. Con la posibilidad de aprendizaje por refuerzo sin modelo, es posible construir un sistema de control de temperatura que aprenda las dependencias comunes tanto del proceso utilizado como de su entorno operativo, sin necesidad de depender de una comprensión completa de las interrelaciones físicas. En este documento, se presenta un enfoque de aprendizaje por refuerzo basado en el algoritmo de gradiente de política determinista profundo (DDPG), con el objetivo de controlar la temperatura de un efector final ATL basado en emisores infrarrojos. El algoritmo fue adaptado a la inercia térmica del sistema y entrenado en un entorno de proceso real. Con solo una pequeña cantidad de datos de entrenamiento, el agente DDPG entrenado pudo mantener de manera confiable las temperaturas del proceso ATL dentro de un rango de tolerancia especificado. Al aplicar esta técnica, la cinta UD se puede depositar a una temperatura de proceso constante durante tiempos de proceso más largos sin necesidad de un sistema de enfriamiento. Reducir la complejidad del proceso puede ayudar a aumentar la prevalencia de componentes ligeros y, por lo tanto, contribuir a un menor consumo de energía de los vehículos eléctricos.