Estrategia de Persecución en Dos Etapas para una Misión de Persecución-Evasión Espacial de Información Incompleta e Impulsiva Usando Aprendizaje por Refuerzo

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Estrategia de Persecución en Dos Etapas para una Misión de Persecución-Evasión Espacial de Información Incompleta e Impulsiva Usando Aprendizaje por Refuerzo

Autores: Yang, Bin; Liu, Pengxuan; Feng, Jinglang; Li, Shuang

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico

2021

Estrategia de Persecución en Dos Etapas para una Misión de Persecución-Evasión Espacial de Información Incompleta e Impulsiva Usando Aprendizaje por Refuerzo

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Aeroespacial

Palabras clave

Novela

Robusto

Estrategia de búsqueda

Espacio impulsivo

Perturbación J2

Etapa de encuentro

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 17

Citaciones: Sin citaciones

Este documento presenta una estrategia de persecución de dos etapas, novedosa y robusta, para misiones de persecución y evasión en el espacio con información incompleta, considerando la perturbación J2. La estrategia primero modela el problema del juego de persecución y evasión impulsiva en una etapa de encuentro a larga distancia y una etapa de juego a corta distancia, de acuerdo con el rango de percepción del evadido. Para la etapa de encuentro a larga distancia, se transforma en un problema de optimización de trayectoria de encuentro y se propone una nueva función objetivo para obtener la trayectoria de persecución con la capacidad de persecución terminal óptima. Para la etapa de juego a corta distancia, se propone un enfoque de persecución en bucle cerrado utilizando uno de los algoritmos de aprendizaje por refuerzo, es decir, el algoritmo de gradiente de política determinista profunda, para resolver y actualizar la trayectoria de persecución para las misiones de persecución y evasión impulsivas con información incompleta. Se demuestra la viabilidad de esta nueva estrategia y su robustez ante diferentes estados iniciales del perseguidor y el evadido, así como ante las estrategias de evasión, en los escenarios de juego de persecución y evasión en órbita sincrónica con el sol. Los resultados de las pruebas de Monte Carlo muestran que la tasa de éxito de persecución del método propuesto es superior al 91% para todos los escenarios dados.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro