logo móvil
Contáctanos

Un método de toma de decisiones para maniobras de evasión de misiles autónomos orientado a misiones para vehículos aéreos no tripulados

Autores: Luo, Yuequn; Ruan, Chengwei; Ding, Dali; Wang, Zehua; An, Hang; Wang, Fumin; Tan, Mulai; Zhou, Anqiang; Zhou, Huan

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

Un método de toma de decisiones para maniobras de evasión de misiles autónomos orientado a misiones para vehículos aéreos no tripulados


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Entorno de juego aéreo
UAVs
Métodos de toma de decisiones para maniobras de evasión autónoma
Maniobra de evasión de misiles
Algoritmo ARMH-PPO
Transferibilidad multiplataforma

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
El entorno del juego aéreo es complejo. Para mejorar las tasas de éxito de las misiones, los UAV deben considerar de manera integral las amenazas desde diversas direcciones y distancias, así como los métodos de toma de decisiones para maniobras de evasión autónoma para múltiples plataformas de UAV, en lugar de centrarse únicamente en las amenazas de direcciones y distancias específicas o en los métodos de toma de decisiones para plataformas de UAV fijas. En consecuencia, este estudio propone un método de toma de decisiones para maniobras de evasión de misiles autónomos para UAV, adecuado para requisitos de misión transferibles en múltiples escenarios y plataformas. Se establece un modelo tridimensional de persecución-evasión de UAV-misil, junto con modelos de espacio de estado, espacio de acción de maniobra jerárquico y función de recompensa para la evasión autónoma de misiles. Se propone el algoritmo de optimización de políticas proximales multi-híbrido autorregresivo (ARMH-PPO) para este modelo, integrando estructuras de red autorregresivas y utilizando redes de memoria a largo y corto plazo (LSTM) para extraer características temporales. Basándose en los principios del aprendizaje por currículum de exploración, se implementa la fusión temporal de las funciones de recompensa de proceso y evento para guiar conjuntamente el proceso de aprendizaje del agente a través de la experiencia humana y la exploración de estrategias. Además, se introduce un método de integración proporcional y diferenciación (PID) para controlar la ejecución de maniobras del UAV, reduciendo el acoplamiento entre las cantidades de control de maniobra y el objeto de simulación. Los experimentos de simulación y el análisis de resultados demuestran que el algoritmo propuesto ocupa el primer lugar tanto en el valor promedio de recompensa como en las métricas de tasa de éxito de evasión promedio, con una tasa de éxito de evasión promedio aproximadamente un 8% más alta que la del segundo algoritmo clasificado. En los tres escenarios iniciales donde el misil se posiciona lateralmente, de frente y detrás del UAV, las tasas de éxito de evasión de misiles del UAV son del 95%, 70% y 85%, respectivamente. Los resultados de simulación multi-plataforma demuestran que el modelo de decisión construido en este documento exhibe un cierto grado de transferibilidad multi-plataforma.

Otros recursos que podrían interesarte

Temas Virtualpro