logo móvil
Contáctanos

Ley de guía adaptativa restringida por ángulo de impacto basada en aprendizaje profundo de refuerzo

Autores: Hu, Zhe; Yi, Wenjun; Xiao, Liang

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

Ley de guía adaptativa restringida por ángulo de impacto basada en aprendizaje profundo de refuerzo


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Avanzado
Modo deslizante
Aprendizaje por refuerzo
Sistema de control
Ley de guía
Precisión

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 29

Citaciones: Sin citaciones


Descripción
Este estudio presenta una ley de guiado de modo deslizante de segundo orden avanzada con una restricción del ángulo de impacto terminal, que combina ingeniosamente algoritmos de aprendizaje por refuerzo con la teoría de control de modo deslizante terminal no singular (NTSM). Este enfoque híbrido mitiga eficazmente el problema inherente de vibración comúnmente asociado con el control de modo deslizante, al tiempo que mantiene altos niveles de precisión del sistema de control. introducimos un parámetro al algoritmo de super-twisting y posteriormente mejoramos un algoritmo inteligente adaptativo de parámetros basado en el marco del Gradiente de Política Determinista Profunda con Retardo Doble (TD3). Durante la fase de guiado, se emplea un modelo de aprendizaje por refuerzo pre-entrenado para mapear directamente las variables de estado del misil a los parámetros adaptativos óptimos, mejorando significativamente el rendimiento del guiado. Además, se introduce un observador de estado extendido de super-twisting generalizado (GSTESO) para estimar y compensar la incertidumbre agrupada dentro del sistema de guiado del misil. Este método elimina la necesidad de información previa sobre las maniobras del objetivo, lo que permite a la ley de guiado propuesta interceptar objetivos en maniobra con aceleración desconocida. La estabilidad en tiempo finito del sistema de guiado en lazo cerrado se confirma utilizando el criterio de estabilidad de Lyapunov. Las simulaciones demuestran que nuestra ley de guiado propuesta no solo cumple con una amplia gama de restricciones de ángulo de impacto, sino que también logra una mayor precisión de intercepción y una tasa de convergencia más rápida y un mejor rendimiento general en comparación con las leyes de guiado tradicionales NTSM y la guía de super-twisting NTSM (ST-NTSM). La precisión de intercepción es inferior a 0.1 m, y el error del ángulo de impacto es inferior a 0.01 grados.

Otros recursos que podrían interesarte

Temas Virtualpro