logo móvil
Contáctanos

Estrategia de Gestión de Energía Adaptativa para Vehículos Eléctricos Híbridos en Entornos Dinámicos Basada en Aprendizaje por Refuerzo

Autores: Song, Shixin; Zhang, Cewei; Qi, Chunyang; Song, Chuanxue; Xiao, Feng; Jin, Liqiang; Teng, Fei

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Estrategia de Gestión de Energía Adaptativa para Vehículos Eléctricos Híbridos en Entornos Dinámicos Basada en Aprendizaje por Refuerzo


Categoría

Procesos industriales

Subcategoría

Diseño de procesos industriales

Palabras clave

Estrategias de gestión de energía
Algoritmos de aprendizaje por refuerzo
Entornos dinámicos
Estrategia de aprendizaje adaptativo
Economía de combustible de vehículos eléctricos híbridos
Biblioteca de memoria

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 22

Citaciones: Sin citaciones


Descripción
Las estrategias de gestión de energía suelen emplear algoritmos de aprendizaje por refuerzo en un estado estático. Sin embargo, durante la operación del vehículo, el entorno es dinámico y está cargado de incertidumbres y interrupciones imprevistas. Este estudio propone una estrategia de aprendizaje adaptativa en entornos dinámicos que adapta las acciones a las circunstancias cambiantes, aprovechando la experiencia pasada para mejorar el aprendizaje futuro en el mundo real. Desarrollamos una biblioteca de memoria para entornos dinámicos, empleamos agrupamiento de Dirichlet para las condiciones de conducción e incorporamos el algoritmo de maximización de la expectativa para la actualización oportuna del modelo y absorber completamente el conocimiento previo. El agente se adapta rápidamente al entorno dinámico y converge rápidamente, mejorando la economía de combustible de los vehículos eléctricos híbridos en un 5-10% mientras mantiene el estado final de carga (SOC). El punto de operación del motor de nuestro algoritmo fluctúa menos y el estado de trabajo es compacto en comparación con los algoritmos Deep Q-Network (DQN) y Deterministic Policy Gradient (DDPG). Este estudio proporciona una solución para los agentes de vehículos en condiciones ambientales dinámicas, permitiéndoles evaluar lógicamente las experiencias pasadas y llevar a cabo acciones apropiadas para la situación.

Otros recursos que podrían interesarte

Temas Virtualpro