logo móvil
Contáctanos

Estrategia de penetración para vehículos aéreos no tripulados de alta velocidad: un enfoque de aprendizaje profundo por refuerzo basado en memoria

Autores: Zhang, Xiaojie; Guo, Hang; Yan, Tian; Wang, Xiaoming; Sun, Wendi; Fu, Wenxing; Yan, Jie

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Estrategia de penetración para vehículos aéreos no tripulados de alta velocidad: un enfoque de aprendizaje profundo por refuerzo basado en memoria


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Desarrollo
Medidas de interceptación
UAVs de alta velocidad
Tecnología de Inteligencia Artificial
Aprendizaje por Refuerzo Profundo
Redes LSTM

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Con el desarrollo y fortalecimiento de las medidas de interceptación, los métodos tradicionales de penetración de vehículos aéreos no tripulados (VANT) de alta velocidad ya no pueden cumplir con los requisitos de penetración en escenarios de combate diversificados y complejos. Debido al avance de la tecnología de Inteligencia Artificial en los últimos años, los métodos de penetración inteligentes han ido convirtiéndose gradualmente en soluciones prometedoras. En este artículo, se propone una estrategia de penetración para VANT de alta velocidad basada en un Aprendizaje por Refuerzo Profundo (DRL) mejorado, en la que se incorporan redes de Memoria a Largo y Corto Plazo (LSTM) en un algoritmo clásico de Actor-Crítico Suave (SAC). Se construye un escenario de compromiso plano tridimensional (3D) de un VANT de alta velocidad enfrentándose a dos interceptores con gran maniobrabilidad. Según el enfoque LSTM-SAC propuesto, la función de recompensa se diseña en función de los criterios para una penetración exitosa, teniendo en cuenta las restricciones de energía y rango de vuelo. Luego, se obtiene una estrategia de penetración inteligente mediante un extenso entrenamiento, que utiliza los estados de movimiento de ambas partes para tomar decisiones y generar los comandos de sobrecarga de penetración para el VANT de alta velocidad. Los resultados de la simulación muestran que, en comparación con el algoritmo SAC clásico, el algoritmo propuesto tiene una mejora en la eficiencia de entrenamiento del 75.56% en la reducción de episodios de entrenamiento. Mientras tanto, el enfoque LSTM-SAC logra una tasa de penetración exitosa de más del 90% en escenarios complejos hipotéticos, con un aumento promedio del 40% en comparación con los métodos de penetración programados convencionales.

Otros recursos que podrían interesarte

Temas Virtualpro