Estrategia de Gestión de Energía Adaptativa para Vehículos Eléctricos Híbridos en Entornos Dinámicos Basada en Aprendizaje por Refuerzo
Autores: Song, Shixin; Zhang, Cewei; Qi, Chunyang; Song, Chuanxue; Xiao, Feng; Jin, Liqiang; Teng, Fei
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Estrategia de Gestión de Energía Adaptativa para Vehículos Eléctricos Híbridos en Entornos Dinámicos Basada en Aprendizaje por Refuerzo
Categoría
Procesos industriales
Subcategoría
Diseño de procesos industriales
Palabras clave
Estrategias de gestión de energía
Algoritmos de aprendizaje por refuerzo
Entornos dinámicos
Estrategia de aprendizaje adaptativo
Economía de combustible de vehículos eléctricos híbridos
Biblioteca de memoria
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
Las estrategias de gestión de energía suelen emplear algoritmos de aprendizaje por refuerzo en un estado estático. Sin embargo, durante la operación del vehículo, el entorno es dinámico y está cargado de incertidumbres y interrupciones imprevistas. Este estudio propone una estrategia de aprendizaje adaptativa en entornos dinámicos que adapta las acciones a las circunstancias cambiantes, aprovechando la experiencia pasada para mejorar el aprendizaje futuro en el mundo real. Desarrollamos una biblioteca de memoria para entornos dinámicos, empleamos agrupamiento de Dirichlet para las condiciones de conducción e incorporamos el algoritmo de maximización de la expectativa para la actualización oportuna del modelo y absorber completamente el conocimiento previo. El agente se adapta rápidamente al entorno dinámico y converge rápidamente, mejorando la economía de combustible de los vehículos eléctricos híbridos en un 5-10% mientras mantiene el estado final de carga (SOC). El punto de operación del motor de nuestro algoritmo fluctúa menos y el estado de trabajo es compacto en comparación con los algoritmos Deep Q-Network (DQN) y Deterministic Policy Gradient (DDPG). Este estudio proporciona una solución para los agentes de vehículos en condiciones ambientales dinámicas, permitiéndoles evaluar lógicamente las experiencias pasadas y llevar a cabo acciones apropiadas para la situación.
Descripción
Las estrategias de gestión de energía suelen emplear algoritmos de aprendizaje por refuerzo en un estado estático. Sin embargo, durante la operación del vehículo, el entorno es dinámico y está cargado de incertidumbres y interrupciones imprevistas. Este estudio propone una estrategia de aprendizaje adaptativa en entornos dinámicos que adapta las acciones a las circunstancias cambiantes, aprovechando la experiencia pasada para mejorar el aprendizaje futuro en el mundo real. Desarrollamos una biblioteca de memoria para entornos dinámicos, empleamos agrupamiento de Dirichlet para las condiciones de conducción e incorporamos el algoritmo de maximización de la expectativa para la actualización oportuna del modelo y absorber completamente el conocimiento previo. El agente se adapta rápidamente al entorno dinámico y converge rápidamente, mejorando la economía de combustible de los vehículos eléctricos híbridos en un 5-10% mientras mantiene el estado final de carga (SOC). El punto de operación del motor de nuestro algoritmo fluctúa menos y el estado de trabajo es compacto en comparación con los algoritmos Deep Q-Network (DQN) y Deterministic Policy Gradient (DDPG). Este estudio proporciona una solución para los agentes de vehículos en condiciones ambientales dinámicas, permitiéndoles evaluar lógicamente las experiencias pasadas y llevar a cabo acciones apropiadas para la situación.