logo móvil
Contáctanos

Control de Motor de Ciclo Variable de Amplio Rango Basado en Aprendizaje por Refuerzo Profundo

Autores: Ding, Yaoyao; Wang, Fengming; Mu, Yuanwei; Sun, Hongfei

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

Control de Motor de Ciclo Variable de Amplio Rango Basado en Aprendizaje por Refuerzo Profundo


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Aeroespacial

Palabras clave

Propuesto
Aprendizaje por refuerzo profundo
Motor de ciclo variable
Método de diseño de controladores
Condiciones de operación multivariable
Experimentos de simulación

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 24

Citaciones: Sin citaciones


Descripción
En este artículo, se propone un método de diseño de controladores basado en el aprendizaje por refuerzo profundo para un motor de ciclo variable de amplio rango con una arquitectura mixta de interetapas de turbina. El controlador PID está sujeto a limitaciones, incluyendo limitaciones de entrada única y salida única, baja eficiencia de regulación y mala adaptabilidad cuando se enfrenta a motores de ciclo variable contemporáneos que exhiben condiciones de operación complejas y multivariables. Para resolver este problema, este artículo adopta un método de aprendizaje por refuerzo profundo basado en un algoritmo de gradiente de política determinista profunda, y aplica una técnica de poda del espacio de acción para optimizar el controlador, lo que mejora significativamente la velocidad de convergencia del entrenamiento de la red. Con el fin de verificar el rendimiento del control, se seleccionan dos condiciones de vuelo típicas para experimentos de simulación de la siguiente manera: en el primer escenario, H = 0 km y Ma = 0, mientras que en el segundo escenario, H = 10 km y Ma = 0.9. Una comparación de los resultados de la simulación muestra que el controlador de aprendizaje por refuerzo profundo propuesto aborda eficazmente el problema de control de acoplamiento multivariable del motor. Además, reduce el tiempo de respuesta en un promedio del 44.5%, manteniendo un nivel de sobreimpulso similar al del controlador PID.

Otros recursos que podrían interesarte

Temas Virtualpro