Ley de guía adaptativa restringida por ángulo de impacto basada en aprendizaje profundo de refuerzo
Autores: Hu, Zhe; Yi, Wenjun; Xiao, Liang
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Ley de guía adaptativa restringida por ángulo de impacto basada en aprendizaje profundo de refuerzo
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Avanzado
Modo deslizante
Aprendizaje por refuerzo
Sistema de control
Ley de guía
Precisión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
Este estudio presenta una ley de guiado de modo deslizante de segundo orden avanzada con una restricción del ángulo de impacto terminal, que combina ingeniosamente algoritmos de aprendizaje por refuerzo con la teoría de control de modo deslizante terminal no singular (NTSM). Este enfoque híbrido mitiga eficazmente el problema inherente de vibración comúnmente asociado con el control de modo deslizante, al tiempo que mantiene altos niveles de precisión del sistema de control. introducimos un parámetro al algoritmo de super-twisting y posteriormente mejoramos un algoritmo inteligente adaptativo de parámetros basado en el marco del Gradiente de Política Determinista Profunda con Retardo Doble (TD3). Durante la fase de guiado, se emplea un modelo de aprendizaje por refuerzo pre-entrenado para mapear directamente las variables de estado del misil a los parámetros adaptativos óptimos, mejorando significativamente el rendimiento del guiado. Además, se introduce un observador de estado extendido de super-twisting generalizado (GSTESO) para estimar y compensar la incertidumbre agrupada dentro del sistema de guiado del misil. Este método elimina la necesidad de información previa sobre las maniobras del objetivo, lo que permite a la ley de guiado propuesta interceptar objetivos en maniobra con aceleración desconocida. La estabilidad en tiempo finito del sistema de guiado en lazo cerrado se confirma utilizando el criterio de estabilidad de Lyapunov. Las simulaciones demuestran que nuestra ley de guiado propuesta no solo cumple con una amplia gama de restricciones de ángulo de impacto, sino que también logra una mayor precisión de intercepción y una tasa de convergencia más rápida y un mejor rendimiento general en comparación con las leyes de guiado tradicionales NTSM y la guía de super-twisting NTSM (ST-NTSM). La precisión de intercepción es inferior a 0.1 m, y el error del ángulo de impacto es inferior a 0.01 grados.
Descripción
Este estudio presenta una ley de guiado de modo deslizante de segundo orden avanzada con una restricción del ángulo de impacto terminal, que combina ingeniosamente algoritmos de aprendizaje por refuerzo con la teoría de control de modo deslizante terminal no singular (NTSM). Este enfoque híbrido mitiga eficazmente el problema inherente de vibración comúnmente asociado con el control de modo deslizante, al tiempo que mantiene altos niveles de precisión del sistema de control. introducimos un parámetro al algoritmo de super-twisting y posteriormente mejoramos un algoritmo inteligente adaptativo de parámetros basado en el marco del Gradiente de Política Determinista Profunda con Retardo Doble (TD3). Durante la fase de guiado, se emplea un modelo de aprendizaje por refuerzo pre-entrenado para mapear directamente las variables de estado del misil a los parámetros adaptativos óptimos, mejorando significativamente el rendimiento del guiado. Además, se introduce un observador de estado extendido de super-twisting generalizado (GSTESO) para estimar y compensar la incertidumbre agrupada dentro del sistema de guiado del misil. Este método elimina la necesidad de información previa sobre las maniobras del objetivo, lo que permite a la ley de guiado propuesta interceptar objetivos en maniobra con aceleración desconocida. La estabilidad en tiempo finito del sistema de guiado en lazo cerrado se confirma utilizando el criterio de estabilidad de Lyapunov. Las simulaciones demuestran que nuestra ley de guiado propuesta no solo cumple con una amplia gama de restricciones de ángulo de impacto, sino que también logra una mayor precisión de intercepción y una tasa de convergencia más rápida y un mejor rendimiento general en comparación con las leyes de guiado tradicionales NTSM y la guía de super-twisting NTSM (ST-NTSM). La precisión de intercepción es inferior a 0.1 m, y el error del ángulo de impacto es inferior a 0.01 grados.