Uso de Aprendizaje por Refuerzo Profundo Mejorado por Gráficos para la Recuperación de Fallos en Redes de Distribución

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Uso de Aprendizaje por Refuerzo Profundo Mejorado por Gráficos para la Recuperación de Fallos en Redes de Distribución

Autores: Liu, Yueran; Liao, Peng; Wang, Yang

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico

2025

Uso de Aprendizaje por Refuerzo Profundo Mejorado por Gráficos para la Recuperación de Fallos en Redes de Distribución

Categoría

Tecnología de Equipos y Accesorios

Subcategoría

Diseño de equipos y herramientas

Palabras clave

Recuperación de fallos

Redes de distribución

Aprendizaje profundo por refuerzo

Basado en grafos

Multiagente

Restauración

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 26

Citaciones: Sin citaciones

La recuperación de fallos en redes de distribución es una tarea de toma de decisiones compleja y de alta dimensión, caracterizada por la observabilidad parcial, la topología dinámica y las fuertes interdependencias entre los componentes. Para abordar estos desafíos, este artículo propone un marco de aprendizaje por refuerzo profundo (DRL) basado en grafos y multiagente para la restauración inteligente de fallos en redes de distribución de energía. El problema de restauración se modela como un proceso de decisión de Markov parcialmente observable (POMDP), donde cada agente emplea redes neuronales de grafos para extraer características topológicas y mejorar la percepción ambiental. Para abordar la alta dimensionalidad del espacio de acciones, se introduce una estrategia de descomposición de acciones, tratando cada operación de interruptor como una tarea de clasificación binaria independiente, lo que mejora la convergencia y la eficiencia en la toma de decisiones. Además, se diseña un mecanismo de recompensa colaborativa para promover la coordinación entre los agentes y optimizar el rendimiento global de restauración. Los experimentos en el sistema de 69 buses de PG&E demuestran que el método propuesto supera significativamente las líneas base de DRL existentes. Específicamente, logra hasta un 2.6% más de recuperación de carga, hasta 0.0 p.u. menos de costo de recuperación y una restauración completa en el escenario de mediodía, con mejoras estadísticamente significativas. Estos resultados destacan la efectividad del aprendizaje basado en grafos y las recompensas cooperativas para mejorar la resiliencia, eficiencia y adaptabilidad de las operaciones de la red de distribución bajo diversas condiciones.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro