Optimización Multi-Objetivo Basada en Aprendizaje por Refuerzo para la Programación de Generación en Sistemas de Potencia

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Optimización Multi-Objetivo Basada en Aprendizaje por Refuerzo para la Programación de Generación en Sistemas de Potencia

Autores: Ebrie, Awol Seid; Kim, Young Jin

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Optimización Multi-Objetivo Basada en Aprendizaje por Refuerzo para la Programación de Generación en Sistemas de Potencia

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Sistemas

Palabras clave

Programación de potencia

Multiobjetivo

Aprendizaje profundo por refuerzo

Algoritmo de optimización

Procesos de decisión de Markov

Sistemas de prueba experimental

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 28

Citaciones: Sin citaciones

La programación de potencia multiobjetivo (MOPS) tiene como objetivo abordar la minimización simultánea de los costos económicos y diferentes tipos de emisiones ambientales durante la generación de electricidad. Reconociéndolo como un problema NP-duro, este artículo propone un novedoso algoritmo de optimización basado en el aprendizaje profundo por refuerzo multiagente (MADRL). Dentro de un entorno de simulación multiagente personalizado, que representa las unidades generadoras de energía como tipos colaborativos de agentes de aprendizaje por refuerzo (RL), el problema MOPS se descompone en procesos de decisión de Markov secuenciales (MDPs). Los MDPs se utilizan luego para entrenar un modelo MADRL, que posteriormente ofrece la solución óptima al problema de optimización. La viabilidad práctica del método propuesto se evalúa en varios sistemas de prueba experimentales que constan de hasta 100 unidades con problemas biobjetivo y triobjetivo. Los resultados demuestran que el algoritmo MADRL propuesto tiene un mejor rendimiento en comparación con métodos establecidos, como la optimización basada en el aprendizaje por enseñanza (TLBO), la optimización del lobo gris codificado real (RCGWO), el algoritmo evolutivo basado en descomposición (EAD), el algoritmo de clasificación no dominada II (NSGA-II) y el algoritmo de clasificación no dominada III (NSGA-III).

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro