Control de Aprendizaje por Refuerzo Profundo de Extremo a Extremo para Sistemas HVAC en Edificios de Oficinas
Autores: Zhong, Xuyang; Zhang, Zhiang; Zhang, Ruijun; Zhang, Chenlu
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Control de Aprendizaje por Refuerzo Profundo de Extremo a Extremo para Sistemas HVAC en Edificios de Oficinas
Categoría
Procesos industriales
Subcategoría
Diseño de procesos industriales
Palabras clave
HVAC
Eficiencia energética
Aprendizaje por refuerzo
Método de control
Confort térmico interior
Aprendizaje profundo por refuerzo.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
El sistema de calefacción, ventilación y aire acondicionado (HVAC) es un gran consumidor de energía en los edificios de oficinas, y su funcionamiento es crítico para el confort térmico interior. Si bien estudios anteriores han indicado que el control mediante aprendizaje por refuerzo puede mejorar la eficiencia energética del HVAC, no proporcionaron suficiente información sobre el control de extremo a extremo (es decir, desde observaciones en bruto hasta señales de control listas para implementar) para sistemas HVAC centralizados en edificios de múltiples zonas debido a las limitaciones de los métodos de aprendizaje por refuerzo o a que los edificios de prueba eran zonas individuales con sistemas HVAC independientes. Este estudio desarrolló un método de control dinámico de HVAC de extremo a extremo sin modelo basado en un marco de aprendizaje profundo por refuerzo propuesto recientemente para controlar el sistema HVAC centralizado de un edificio de oficinas de múltiples zonas. Al utilizar la red neuronal profunda, el método de control propuesto podría tomar directamente parámetros medibles, incluyendo las condiciones climáticas y del entorno interior, como entradas y controlar los puntos de ajuste de temperatura interior a un nivel de supervisión. En algunos casos de prueba, el método de control propuesto pudo aprender con éxito una política de control dinámica para reducir el consumo de energía del HVAC en un 12.8% en comparación con el caso base utilizando métodos de control convencionales, sin comprometer el confort térmico. Sin embargo, se observó un problema de sobreajuste, lo que indica que el trabajo futuro debería centrarse primero en la generalización del aprendizaje profundo por refuerzo.
Descripción
El sistema de calefacción, ventilación y aire acondicionado (HVAC) es un gran consumidor de energía en los edificios de oficinas, y su funcionamiento es crítico para el confort térmico interior. Si bien estudios anteriores han indicado que el control mediante aprendizaje por refuerzo puede mejorar la eficiencia energética del HVAC, no proporcionaron suficiente información sobre el control de extremo a extremo (es decir, desde observaciones en bruto hasta señales de control listas para implementar) para sistemas HVAC centralizados en edificios de múltiples zonas debido a las limitaciones de los métodos de aprendizaje por refuerzo o a que los edificios de prueba eran zonas individuales con sistemas HVAC independientes. Este estudio desarrolló un método de control dinámico de HVAC de extremo a extremo sin modelo basado en un marco de aprendizaje profundo por refuerzo propuesto recientemente para controlar el sistema HVAC centralizado de un edificio de oficinas de múltiples zonas. Al utilizar la red neuronal profunda, el método de control propuesto podría tomar directamente parámetros medibles, incluyendo las condiciones climáticas y del entorno interior, como entradas y controlar los puntos de ajuste de temperatura interior a un nivel de supervisión. En algunos casos de prueba, el método de control propuesto pudo aprender con éxito una política de control dinámica para reducir el consumo de energía del HVAC en un 12.8% en comparación con el caso base utilizando métodos de control convencionales, sin comprometer el confort térmico. Sin embargo, se observó un problema de sobreajuste, lo que indica que el trabajo futuro debería centrarse primero en la generalización del aprendizaje profundo por refuerzo.