Multi-agent basado en DRL para programación de recursos y gestión energética para vehículos eléctricos
Autores: Zhang, Zhewei; Yu, Chengbo; Tian, Bingxin
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Multi-agent basado en DRL para programación de recursos y gestión energética para vehículos eléctricos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Emergencia
Computación en el borde vehicular
Vehículos eléctricos
Descarga de cálculos
Programación de carga
Aprendizaje por refuerzo multiagente
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 39
Citaciones: Sin citaciones
Con la aparición de la computación de borde vehicular (VEC) y los vehículos eléctricos (EV), integrar tareas de computación y carga presenta desafíos debido a los recursos limitados y las redes vehiculares dinámicas. Esta investigación se centra en la optimización conjunta de la descarga de computación y la programación de carga en redes VEC. Específicamente, optimizamos el factor de descarga, la variable de asociación de carga y las tasas de carga para minimizar el retraso del sistema y el consumo de energía aprovechando los múltiples atributos de los EV en las redes de información y energía. Considerando el entorno dinámico, modelamos el problema como un Proceso de Decisión de Markov y utilizamos el algoritmo de Aprendizaje por Refuerzo Multiagente (MARL) MADDPG, con sus mecanismos de entrenamiento centralizado y ejecución distribuida. Los resultados de la simulación demuestran que este enfoque mejora significativamente la utilidad al tiempo que reduce el consumo de energía y la latencia.
Descripción
Con la aparición de la computación de borde vehicular (VEC) y los vehículos eléctricos (EV), integrar tareas de computación y carga presenta desafíos debido a los recursos limitados y las redes vehiculares dinámicas. Esta investigación se centra en la optimización conjunta de la descarga de computación y la programación de carga en redes VEC. Específicamente, optimizamos el factor de descarga, la variable de asociación de carga y las tasas de carga para minimizar el retraso del sistema y el consumo de energía aprovechando los múltiples atributos de los EV en las redes de información y energía. Considerando el entorno dinámico, modelamos el problema como un Proceso de Decisión de Markov y utilizamos el algoritmo de Aprendizaje por Refuerzo Multiagente (MARL) MADDPG, con sus mecanismos de entrenamiento centralizado y ejecución distribuida. Los resultados de la simulación demuestran que este enfoque mejora significativamente la utilidad al tiempo que reduce el consumo de energía y la latencia.