Ley de guía adaptativa restringida por ángulo de impacto basada en aprendizaje profundo de refuerzo

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Ley de guía adaptativa restringida por ángulo de impacto basada en aprendizaje profundo de refuerzo

Autores: Hu, Zhe; Yi, Wenjun; Xiao, Liang

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico

2025

Ley de guía adaptativa restringida por ángulo de impacto basada en aprendizaje profundo de refuerzo

Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Avanzado

Modo deslizante

Aprendizaje por refuerzo

Sistema de control

Ley de guía

Precisión

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 29

Citaciones: Sin citaciones

Este estudio presenta una ley de guiado de modo deslizante de segundo orden avanzada con una restricción del ángulo de impacto terminal, que combina ingeniosamente algoritmos de aprendizaje por refuerzo con la teoría de control de modo deslizante terminal no singular (NTSM). Este enfoque híbrido mitiga eficazmente el problema inherente de vibración comúnmente asociado con el control de modo deslizante, al tiempo que mantiene altos niveles de precisión del sistema de control. introducimos un parámetro al algoritmo de super-twisting y posteriormente mejoramos un algoritmo inteligente adaptativo de parámetros basado en el marco del Gradiente de Política Determinista Profunda con Retardo Doble (TD3). Durante la fase de guiado, se emplea un modelo de aprendizaje por refuerzo pre-entrenado para mapear directamente las variables de estado del misil a los parámetros adaptativos óptimos, mejorando significativamente el rendimiento del guiado. Además, se introduce un observador de estado extendido de super-twisting generalizado (GSTESO) para estimar y compensar la incertidumbre agrupada dentro del sistema de guiado del misil. Este método elimina la necesidad de información previa sobre las maniobras del objetivo, lo que permite a la ley de guiado propuesta interceptar objetivos en maniobra con aceleración desconocida. La estabilidad en tiempo finito del sistema de guiado en lazo cerrado se confirma utilizando el criterio de estabilidad de Lyapunov. Las simulaciones demuestran que nuestra ley de guiado propuesta no solo cumple con una amplia gama de restricciones de ángulo de impacto, sino que también logra una mayor precisión de intercepción y una tasa de convergencia más rápida y un mejor rendimiento general en comparación con las leyes de guiado tradicionales NTSM y la guía de super-twisting NTSM (ST-NTSM). La precisión de intercepción es inferior a 0.1 m, y el error del ángulo de impacto es inferior a 0.01 grados.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro