Estrategia de Gestión de Energía Adaptativa para Vehículos Eléctricos Híbridos en Entornos Dinámicos Basada en Aprendizaje por Refuerzo

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Estrategia de Gestión de Energía Adaptativa para Vehículos Eléctricos Híbridos en Entornos Dinámicos Basada en Aprendizaje por Refuerzo

Autores: Song, Shixin; Zhang, Cewei; Qi, Chunyang; Song, Chuanxue; Xiao, Feng; Jin, Liqiang; Teng, Fei

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Estrategia de Gestión de Energía Adaptativa para Vehículos Eléctricos Híbridos en Entornos Dinámicos Basada en Aprendizaje por Refuerzo

Categoría

Procesos industriales

Subcategoría

Diseño de procesos industriales

Palabras clave

Estrategias de gestión de energía

Algoritmos de aprendizaje por refuerzo

Entornos dinámicos

Estrategia de aprendizaje adaptativo

Economía de combustible de vehículos eléctricos híbridos

Biblioteca de memoria

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 22

Citaciones: Sin citaciones

Las estrategias de gestión de energía suelen emplear algoritmos de aprendizaje por refuerzo en un estado estático. Sin embargo, durante la operación del vehículo, el entorno es dinámico y está cargado de incertidumbres y interrupciones imprevistas. Este estudio propone una estrategia de aprendizaje adaptativa en entornos dinámicos que adapta las acciones a las circunstancias cambiantes, aprovechando la experiencia pasada para mejorar el aprendizaje futuro en el mundo real. Desarrollamos una biblioteca de memoria para entornos dinámicos, empleamos agrupamiento de Dirichlet para las condiciones de conducción e incorporamos el algoritmo de maximización de la expectativa para la actualización oportuna del modelo y absorber completamente el conocimiento previo. El agente se adapta rápidamente al entorno dinámico y converge rápidamente, mejorando la economía de combustible de los vehículos eléctricos híbridos en un 5-10% mientras mantiene el estado final de carga (SOC). El punto de operación del motor de nuestro algoritmo fluctúa menos y el estado de trabajo es compacto en comparación con los algoritmos Deep Q-Network (DQN) y Deterministic Policy Gradient (DDPG). Este estudio proporciona una solución para los agentes de vehículos en condiciones ambientales dinámicas, permitiéndoles evaluar lógicamente las experiencias pasadas y llevar a cabo acciones apropiadas para la situación.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro