Optimización Multi-Objetivo Basada en Aprendizaje por Refuerzo para la Programación de Generación en Sistemas de Potencia
Autores: Ebrie, Awol Seid; Kim, Young Jin
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Optimización Multi-Objetivo Basada en Aprendizaje por Refuerzo para la Programación de Generación en Sistemas de Potencia
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Programación de potencia
Multiobjetivo
Aprendizaje profundo por refuerzo
Algoritmo de optimización
Procesos de decisión de Markov
Sistemas de prueba experimental
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
La programación de potencia multiobjetivo (MOPS) tiene como objetivo abordar la minimización simultánea de los costos económicos y diferentes tipos de emisiones ambientales durante la generación de electricidad. Reconociéndolo como un problema NP-duro, este artículo propone un novedoso algoritmo de optimización basado en el aprendizaje profundo por refuerzo multiagente (MADRL). Dentro de un entorno de simulación multiagente personalizado, que representa las unidades generadoras de energía como tipos colaborativos de agentes de aprendizaje por refuerzo (RL), el problema MOPS se descompone en procesos de decisión de Markov secuenciales (MDPs). Los MDPs se utilizan luego para entrenar un modelo MADRL, que posteriormente ofrece la solución óptima al problema de optimización. La viabilidad práctica del método propuesto se evalúa en varios sistemas de prueba experimentales que constan de hasta 100 unidades con problemas biobjetivo y triobjetivo. Los resultados demuestran que el algoritmo MADRL propuesto tiene un mejor rendimiento en comparación con métodos establecidos, como la optimización basada en el aprendizaje por enseñanza (TLBO), la optimización del lobo gris codificado real (RCGWO), el algoritmo evolutivo basado en descomposición (EAD), el algoritmo de clasificación no dominada II (NSGA-II) y el algoritmo de clasificación no dominada III (NSGA-III).
Descripción
La programación de potencia multiobjetivo (MOPS) tiene como objetivo abordar la minimización simultánea de los costos económicos y diferentes tipos de emisiones ambientales durante la generación de electricidad. Reconociéndolo como un problema NP-duro, este artículo propone un novedoso algoritmo de optimización basado en el aprendizaje profundo por refuerzo multiagente (MADRL). Dentro de un entorno de simulación multiagente personalizado, que representa las unidades generadoras de energía como tipos colaborativos de agentes de aprendizaje por refuerzo (RL), el problema MOPS se descompone en procesos de decisión de Markov secuenciales (MDPs). Los MDPs se utilizan luego para entrenar un modelo MADRL, que posteriormente ofrece la solución óptima al problema de optimización. La viabilidad práctica del método propuesto se evalúa en varios sistemas de prueba experimentales que constan de hasta 100 unidades con problemas biobjetivo y triobjetivo. Los resultados demuestran que el algoritmo MADRL propuesto tiene un mejor rendimiento en comparación con métodos establecidos, como la optimización basada en el aprendizaje por enseñanza (TLBO), la optimización del lobo gris codificado real (RCGWO), el algoritmo evolutivo basado en descomposición (EAD), el algoritmo de clasificación no dominada II (NSGA-II) y el algoritmo de clasificación no dominada III (NSGA-III).