Un método de programación de optimización de escenarios de pequeñas muestras basado en la expansión de datos multidimensionales
Autores: Liu, Yaoxian; Zhang, Kaixin; Sun, Yue; Chen, Jingwen; Chen, Junshuo
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Un método de programación de optimización de escenarios de pequeñas muestras basado en la expansión de datos multidimensionales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Aprendizaje profundo por refuerzo
Optimización del sistema energético
Datos históricos
Muestras de entrenamiento DRL
Producción de energía renovable
Optimización del escenario de muestra pequeña
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 41
Citaciones: Sin citaciones
Actualmente, el aprendizaje profundo por refuerzo se ha aplicado ampliamente a la optimización y programación de sistemas energéticos, y el método DRL depende más de los datos históricos. La falta de datos de operación históricos en los nuevos sistemas energéticos integrados conduce a muestras de entrenamiento DRL insuficientes, lo que fácilmente desencadena problemas de ajuste insuficiente y exploración insuficiente del espacio de decisiones y, por lo tanto, reduce la precisión del plan de programación. Además, los métodos convencionales basados en datos también tienen dificultades para predecir con precisión la producción de energía renovable debido a datos de entrenamiento insuficientes, lo que afecta aún más el efecto de la programación. Por lo tanto, este documento propone un método de programación de optimización de escenarios de pequeñas muestras basado en la expansión de datos multidimensionales. En primer lugar, basado en la correlación espacial, se filtran las curvas de potencia diarias de las plantas de energía fotovoltaica con potencia medida, y se calcula la similitud meteorológica utilizando la máxima diferencia media multicore (MK-MMD) para generar nuevos datos históricos de producción de energía del sistema fotovoltaico distribuido objetivo a través del método de conversión de capacidad; en segundo lugar, basado en los datos de carga diaria existentes de diferentes tipos, se generan los datos históricos de carga utilizando los métodos de muestreo estocástico y simultáneo para construir el conjunto de datos históricos completo; posteriormente, para el problema de desequilibrio de muestras en el escenario de pequeñas muestras, se utiliza un método de sobremuestreo para mejorar los datos de las muestras escasas, y se establece el modelo de predicción de producción fotovoltaica XGBoost; finalmente, el modelo de programación óptima se transforma en un proceso de toma de decisiones markoviano, que se resuelve utilizando el algoritmo Deep Deterministic Policy Gradient (DDPG). La efectividad del método propuesto se verifica mediante ejemplos aritméticos.
Descripción
Actualmente, el aprendizaje profundo por refuerzo se ha aplicado ampliamente a la optimización y programación de sistemas energéticos, y el método DRL depende más de los datos históricos. La falta de datos de operación históricos en los nuevos sistemas energéticos integrados conduce a muestras de entrenamiento DRL insuficientes, lo que fácilmente desencadena problemas de ajuste insuficiente y exploración insuficiente del espacio de decisiones y, por lo tanto, reduce la precisión del plan de programación. Además, los métodos convencionales basados en datos también tienen dificultades para predecir con precisión la producción de energía renovable debido a datos de entrenamiento insuficientes, lo que afecta aún más el efecto de la programación. Por lo tanto, este documento propone un método de programación de optimización de escenarios de pequeñas muestras basado en la expansión de datos multidimensionales. En primer lugar, basado en la correlación espacial, se filtran las curvas de potencia diarias de las plantas de energía fotovoltaica con potencia medida, y se calcula la similitud meteorológica utilizando la máxima diferencia media multicore (MK-MMD) para generar nuevos datos históricos de producción de energía del sistema fotovoltaico distribuido objetivo a través del método de conversión de capacidad; en segundo lugar, basado en los datos de carga diaria existentes de diferentes tipos, se generan los datos históricos de carga utilizando los métodos de muestreo estocástico y simultáneo para construir el conjunto de datos históricos completo; posteriormente, para el problema de desequilibrio de muestras en el escenario de pequeñas muestras, se utiliza un método de sobremuestreo para mejorar los datos de las muestras escasas, y se establece el modelo de predicción de producción fotovoltaica XGBoost; finalmente, el modelo de programación óptima se transforma en un proceso de toma de decisiones markoviano, que se resuelve utilizando el algoritmo Deep Deterministic Policy Gradient (DDPG). La efectividad del método propuesto se verifica mediante ejemplos aritméticos.