Estrategia de gestión de energía basada en aprendizaje por refuerzo profundo para aeronaves de despegue y aterrizaje vertical con sistema de propulsión híbrido turboeléctrico
Autores: Yu, Feifan; Tang, Wang; Chen, Jiajie; Wang, Jiqiang; Sun, Xiaokang; Chen, Xinmin
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Estrategia de gestión de energía basada en aprendizaje por refuerzo profundo para aeronaves de despegue y aterrizaje vertical con sistema de propulsión híbrido turboeléctrico
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Limitaciones
Sistemas de potencia híbridos turboeléctricos
Estrategia de gestión de energía
Aprendizaje por refuerzo profundo
Economía de combustible
Gestión de energía adaptativa
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
Debido a las limitaciones de la resistencia de la energía eléctrica pura, los sistemas de propulsión híbrida turboeléctrica, que ofrecen una alta relación potencia-peso, presentan una solución confiable para aeronaves de despegue y aterrizaje vertical (VTOL) de tamaño mediano y grande. Las estrategias tradicionales de gestión de energía a menudo no logran minimizar el consumo de combustible a lo largo de todo el perfil de vuelo mientras satisfacen las demandas de energía bajo diversas condiciones de vuelo. Para abordar este problema, este documento propone una estrategia de gestión de energía (EMS) basada en aprendizaje por refuerzo profundo (DRL) diseñada específicamente para sistemas de propulsión híbrida turboeléctrica. En primer lugar, la estrategia propuesta emplea un método de Aprendizaje por Refuerzo Profundo Guiado por Conocimiento Previos (PKGDRL), que integra conocimientos específicos del dominio en el algoritmo de Gradiente de Política Determinista Profunda (DDPG) para mejorar la eficiencia del aprendizaje y aumentar la economía de combustible. Luego, al reducir el espacio de exploración, el método PKGDRL acelera la convergencia y logra una superior eficiencia de combustible y energía. Los resultados de simulación muestran que PKGDRL tiene una fuerte capacidad de generalización en todas las condiciones de operación, con una diferencia en la economía de combustible de solo 1.6% respecto al punto de referencia offline del algoritmo de optimización, y además, el módulo PKG permite que el método DRL logre una gran mejora en términos de economía de combustible y tasa de convergencia. En particular, la teoría de prospectos (PT) en el módulo PKG mejora la economía de combustible en un 0.81%. La investigación futura explorará la aplicación de PKGDRL en la dirección de la predicción total de potencia en tiempo real y la gestión de energía adaptativa bajo condiciones de operación complejas para mejorar la capacidad de generalización de la EMS.
Descripción
Debido a las limitaciones de la resistencia de la energía eléctrica pura, los sistemas de propulsión híbrida turboeléctrica, que ofrecen una alta relación potencia-peso, presentan una solución confiable para aeronaves de despegue y aterrizaje vertical (VTOL) de tamaño mediano y grande. Las estrategias tradicionales de gestión de energía a menudo no logran minimizar el consumo de combustible a lo largo de todo el perfil de vuelo mientras satisfacen las demandas de energía bajo diversas condiciones de vuelo. Para abordar este problema, este documento propone una estrategia de gestión de energía (EMS) basada en aprendizaje por refuerzo profundo (DRL) diseñada específicamente para sistemas de propulsión híbrida turboeléctrica. En primer lugar, la estrategia propuesta emplea un método de Aprendizaje por Refuerzo Profundo Guiado por Conocimiento Previos (PKGDRL), que integra conocimientos específicos del dominio en el algoritmo de Gradiente de Política Determinista Profunda (DDPG) para mejorar la eficiencia del aprendizaje y aumentar la economía de combustible. Luego, al reducir el espacio de exploración, el método PKGDRL acelera la convergencia y logra una superior eficiencia de combustible y energía. Los resultados de simulación muestran que PKGDRL tiene una fuerte capacidad de generalización en todas las condiciones de operación, con una diferencia en la economía de combustible de solo 1.6% respecto al punto de referencia offline del algoritmo de optimización, y además, el módulo PKG permite que el método DRL logre una gran mejora en términos de economía de combustible y tasa de convergencia. En particular, la teoría de prospectos (PT) en el módulo PKG mejora la economía de combustible en un 0.81%. La investigación futura explorará la aplicación de PKGDRL en la dirección de la predicción total de potencia en tiempo real y la gestión de energía adaptativa bajo condiciones de operación complejas para mejorar la capacidad de generalización de la EMS.