Estrategia de Persecución en Dos Etapas para una Misión de Persecución-Evasión Espacial de Información Incompleta e Impulsiva Usando Aprendizaje por Refuerzo
Autores: Yang, Bin; Liu, Pengxuan; Feng, Jinglang; Li, Shuang
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Estrategia de Persecución en Dos Etapas para una Misión de Persecución-Evasión Espacial de Información Incompleta e Impulsiva Usando Aprendizaje por Refuerzo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Novela
Robusto
Estrategia de búsqueda
Espacio impulsivo
Perturbación J2
Etapa de encuentro
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 17
Citaciones: Sin citaciones
Este documento presenta una estrategia de persecución de dos etapas, novedosa y robusta, para misiones de persecución y evasión en el espacio con información incompleta, considerando la perturbación J2. La estrategia primero modela el problema del juego de persecución y evasión impulsiva en una etapa de encuentro a larga distancia y una etapa de juego a corta distancia, de acuerdo con el rango de percepción del evadido. Para la etapa de encuentro a larga distancia, se transforma en un problema de optimización de trayectoria de encuentro y se propone una nueva función objetivo para obtener la trayectoria de persecución con la capacidad de persecución terminal óptima. Para la etapa de juego a corta distancia, se propone un enfoque de persecución en bucle cerrado utilizando uno de los algoritmos de aprendizaje por refuerzo, es decir, el algoritmo de gradiente de política determinista profunda, para resolver y actualizar la trayectoria de persecución para las misiones de persecución y evasión impulsivas con información incompleta. Se demuestra la viabilidad de esta nueva estrategia y su robustez ante diferentes estados iniciales del perseguidor y el evadido, así como ante las estrategias de evasión, en los escenarios de juego de persecución y evasión en órbita sincrónica con el sol. Los resultados de las pruebas de Monte Carlo muestran que la tasa de éxito de persecución del método propuesto es superior al 91% para todos los escenarios dados.
Descripción
Este documento presenta una estrategia de persecución de dos etapas, novedosa y robusta, para misiones de persecución y evasión en el espacio con información incompleta, considerando la perturbación J2. La estrategia primero modela el problema del juego de persecución y evasión impulsiva en una etapa de encuentro a larga distancia y una etapa de juego a corta distancia, de acuerdo con el rango de percepción del evadido. Para la etapa de encuentro a larga distancia, se transforma en un problema de optimización de trayectoria de encuentro y se propone una nueva función objetivo para obtener la trayectoria de persecución con la capacidad de persecución terminal óptima. Para la etapa de juego a corta distancia, se propone un enfoque de persecución en bucle cerrado utilizando uno de los algoritmos de aprendizaje por refuerzo, es decir, el algoritmo de gradiente de política determinista profunda, para resolver y actualizar la trayectoria de persecución para las misiones de persecución y evasión impulsivas con información incompleta. Se demuestra la viabilidad de esta nueva estrategia y su robustez ante diferentes estados iniciales del perseguidor y el evadido, así como ante las estrategias de evasión, en los escenarios de juego de persecución y evasión en órbita sincrónica con el sol. Los resultados de las pruebas de Monte Carlo muestran que la tasa de éxito de persecución del método propuesto es superior al 91% para todos los escenarios dados.