logo móvil
Contáctanos

Uso de Aprendizaje por Refuerzo Profundo Mejorado por Gráficos para la Recuperación de Fallos en Redes de Distribución

Autores: Liu, Yueran; Liao, Peng; Wang, Yang

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

Uso de Aprendizaje por Refuerzo Profundo Mejorado por Gráficos para la Recuperación de Fallos en Redes de Distribución


Categoría

Tecnología de Equipos y Accesorios

Subcategoría

Diseño de equipos y herramientas

Palabras clave

Recuperación de fallos
Redes de distribución
Aprendizaje profundo por refuerzo
Basado en grafos
Multiagente
Restauración

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 26

Citaciones: Sin citaciones


Descripción
La recuperación de fallos en redes de distribución es una tarea de toma de decisiones compleja y de alta dimensión, caracterizada por la observabilidad parcial, la topología dinámica y las fuertes interdependencias entre los componentes. Para abordar estos desafíos, este artículo propone un marco de aprendizaje por refuerzo profundo (DRL) basado en grafos y multiagente para la restauración inteligente de fallos en redes de distribución de energía. El problema de restauración se modela como un proceso de decisión de Markov parcialmente observable (POMDP), donde cada agente emplea redes neuronales de grafos para extraer características topológicas y mejorar la percepción ambiental. Para abordar la alta dimensionalidad del espacio de acciones, se introduce una estrategia de descomposición de acciones, tratando cada operación de interruptor como una tarea de clasificación binaria independiente, lo que mejora la convergencia y la eficiencia en la toma de decisiones. Además, se diseña un mecanismo de recompensa colaborativa para promover la coordinación entre los agentes y optimizar el rendimiento global de restauración. Los experimentos en el sistema de 69 buses de PG&E demuestran que el método propuesto supera significativamente las líneas base de DRL existentes. Específicamente, logra hasta un 2.6% más de recuperación de carga, hasta 0.0 p.u. menos de costo de recuperación y una restauración completa en el escenario de mediodía, con mejoras estadísticamente significativas. Estos resultados destacan la efectividad del aprendizaje basado en grafos y las recompensas cooperativas para mejorar la resiliencia, eficiencia y adaptabilidad de las operaciones de la red de distribución bajo diversas condiciones.

Otros recursos que podrían interesarte

Temas Virtualpro