Estrategia de penetración para vehículos aéreos no tripulados de alta velocidad: un enfoque de aprendizaje profundo por refuerzo basado en memoria
Autores: Zhang, Xiaojie; Guo, Hang; Yan, Tian; Wang, Xiaoming; Sun, Wendi; Fu, Wenxing; Yan, Jie
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Estrategia de penetración para vehículos aéreos no tripulados de alta velocidad: un enfoque de aprendizaje profundo por refuerzo basado en memoria
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Desarrollo
Medidas de interceptación
UAVs de alta velocidad
Tecnología de Inteligencia Artificial
Aprendizaje por Refuerzo Profundo
Redes LSTM
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Con el desarrollo y fortalecimiento de las medidas de interceptación, los métodos tradicionales de penetración de vehículos aéreos no tripulados (VANT) de alta velocidad ya no pueden cumplir con los requisitos de penetración en escenarios de combate diversificados y complejos. Debido al avance de la tecnología de Inteligencia Artificial en los últimos años, los métodos de penetración inteligentes han ido convirtiéndose gradualmente en soluciones prometedoras. En este artículo, se propone una estrategia de penetración para VANT de alta velocidad basada en un Aprendizaje por Refuerzo Profundo (DRL) mejorado, en la que se incorporan redes de Memoria a Largo y Corto Plazo (LSTM) en un algoritmo clásico de Actor-Crítico Suave (SAC). Se construye un escenario de compromiso plano tridimensional (3D) de un VANT de alta velocidad enfrentándose a dos interceptores con gran maniobrabilidad. Según el enfoque LSTM-SAC propuesto, la función de recompensa se diseña en función de los criterios para una penetración exitosa, teniendo en cuenta las restricciones de energía y rango de vuelo. Luego, se obtiene una estrategia de penetración inteligente mediante un extenso entrenamiento, que utiliza los estados de movimiento de ambas partes para tomar decisiones y generar los comandos de sobrecarga de penetración para el VANT de alta velocidad. Los resultados de la simulación muestran que, en comparación con el algoritmo SAC clásico, el algoritmo propuesto tiene una mejora en la eficiencia de entrenamiento del 75.56% en la reducción de episodios de entrenamiento. Mientras tanto, el enfoque LSTM-SAC logra una tasa de penetración exitosa de más del 90% en escenarios complejos hipotéticos, con un aumento promedio del 40% en comparación con los métodos de penetración programados convencionales.
Descripción
Con el desarrollo y fortalecimiento de las medidas de interceptación, los métodos tradicionales de penetración de vehículos aéreos no tripulados (VANT) de alta velocidad ya no pueden cumplir con los requisitos de penetración en escenarios de combate diversificados y complejos. Debido al avance de la tecnología de Inteligencia Artificial en los últimos años, los métodos de penetración inteligentes han ido convirtiéndose gradualmente en soluciones prometedoras. En este artículo, se propone una estrategia de penetración para VANT de alta velocidad basada en un Aprendizaje por Refuerzo Profundo (DRL) mejorado, en la que se incorporan redes de Memoria a Largo y Corto Plazo (LSTM) en un algoritmo clásico de Actor-Crítico Suave (SAC). Se construye un escenario de compromiso plano tridimensional (3D) de un VANT de alta velocidad enfrentándose a dos interceptores con gran maniobrabilidad. Según el enfoque LSTM-SAC propuesto, la función de recompensa se diseña en función de los criterios para una penetración exitosa, teniendo en cuenta las restricciones de energía y rango de vuelo. Luego, se obtiene una estrategia de penetración inteligente mediante un extenso entrenamiento, que utiliza los estados de movimiento de ambas partes para tomar decisiones y generar los comandos de sobrecarga de penetración para el VANT de alta velocidad. Los resultados de la simulación muestran que, en comparación con el algoritmo SAC clásico, el algoritmo propuesto tiene una mejora en la eficiencia de entrenamiento del 75.56% en la reducción de episodios de entrenamiento. Mientras tanto, el enfoque LSTM-SAC logra una tasa de penetración exitosa de más del 90% en escenarios complejos hipotéticos, con un aumento promedio del 40% en comparación con los métodos de penetración programados convencionales.