Maniobra de aproximación de naves espaciales basada en aprendizaje por refuerzo profundo asimétrico bajo perturbaciones desconocidas
Autores: Shao, Shibo; Zhou, Dong; Sun, Guanghui; Ma, Weizhao; Deng, Runran
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Maniobra de aproximación de naves espaciales basada en aprendizaje por refuerzo profundo asimétrico bajo perturbaciones desconocidas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Naves espaciales
Métodos de control
Aprendizaje por refuerzo profundo
Maniobra
Perturbaciones
Simulación numérica
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 15
Citaciones: Sin citaciones
El control de maniobras de aproximación de naves espaciales normalmente utiliza métodos de control tradicionales como el Proporcional-Integral-Derivativo (PID) o el Control Predictivo de Modelos (MPC), que requieren un diseño meticuloso del sistema y carecen de robustez frente a perturbaciones desconocidas. Para abordar estas limitaciones, proponemos un algoritmo de maniobra de aproximación de naves espaciales basado en Aprendizaje por Refuerzo Profundo (DRL) asimétrico de extremo a extremo (ADSAM), que mejora significativamente la robustez de la maniobra de aproximación espacial bajo perturbaciones desconocidas a gran escala y Procesos de Decisión de Markov de Observación Parcial (POMDP). Presentamos un entorno de simulación numérica con el modelo lineal de Clohessy-Wiltshire (CW), incorporando el método de Runge-Kutta de 4º orden (RK4) para asegurar una transición de estado más precisa y eficiente. Los resultados experimentales también demuestran que la efectividad del algoritmo propuesto supera a los métodos más avanzados.
Descripción
El control de maniobras de aproximación de naves espaciales normalmente utiliza métodos de control tradicionales como el Proporcional-Integral-Derivativo (PID) o el Control Predictivo de Modelos (MPC), que requieren un diseño meticuloso del sistema y carecen de robustez frente a perturbaciones desconocidas. Para abordar estas limitaciones, proponemos un algoritmo de maniobra de aproximación de naves espaciales basado en Aprendizaje por Refuerzo Profundo (DRL) asimétrico de extremo a extremo (ADSAM), que mejora significativamente la robustez de la maniobra de aproximación espacial bajo perturbaciones desconocidas a gran escala y Procesos de Decisión de Markov de Observación Parcial (POMDP). Presentamos un entorno de simulación numérica con el modelo lineal de Clohessy-Wiltshire (CW), incorporando el método de Runge-Kutta de 4º orden (RK4) para asegurar una transición de estado más precisa y eficiente. Los resultados experimentales también demuestran que la efectividad del algoritmo propuesto supera a los métodos más avanzados.