Aprendizaje por Refuerzo con Referencia a Modelos para la Recuperación Aérea Segura de Vehículos Aéreos No Tripulados
Autores: Zhao, Bocheng; Huo, Mingying; Yu, Ze; Qi, Naiming; Wang, Jianfeng
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Aprendizaje por Refuerzo con Referencia a Modelos para la Recuperación Aérea Segura de Vehículos Aéreos No Tripulados
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Encuentro aéreo
Vehículos aéreos no tripulados
Aeronaves portaaviones
Generación de trayectorias
Modelo de restricciones de seguridad
Aprendizaje por refuerzo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 16
Citaciones: Sin citaciones
En este estudio, proponemos un método de encuentro aéreo para facilitar la recuperación de vehículos aéreos no tripulados (VANT) utilizando aeronaves de transporte, lo cual es una capacidad importante para el uso futuro de los VANT. La principal contribución de este estudio es el desarrollo de un método prometedor para la generación en línea de trayectorias de encuentro factibles para los VANT. Primero, se analiza el vórtice de estela de una aeronave de transporte utilizando el método de elementos finitos, y se propone un método para establecer un modelo de restricción de seguridad. Posteriormente, se propone un algoritmo de aprendizaje por refuerzo basado en referencia de modelo, que puede garantizar la convergencia y estabilidad del entrenamiento. Se diseña una función de recompensa combinada para resolver el problema de generación de trayectorias de los VANT bajo restricciones no convexas. Los resultados de la simulación muestran que, en comparación con el método tradicional de campo potencial artificial bajo diferentes condiciones de trabajo, la tasa de éxito de este método bajo restricciones no convexas se acerca al 100%, con alta precisión, convergencia y estabilidad, y tiene un mayor potencial de aplicación en el escenario de recuperación aérea, proporcionando una solución al problema de generación de trayectorias de los VANT bajo restricciones no convexas.
Descripción
En este estudio, proponemos un método de encuentro aéreo para facilitar la recuperación de vehículos aéreos no tripulados (VANT) utilizando aeronaves de transporte, lo cual es una capacidad importante para el uso futuro de los VANT. La principal contribución de este estudio es el desarrollo de un método prometedor para la generación en línea de trayectorias de encuentro factibles para los VANT. Primero, se analiza el vórtice de estela de una aeronave de transporte utilizando el método de elementos finitos, y se propone un método para establecer un modelo de restricción de seguridad. Posteriormente, se propone un algoritmo de aprendizaje por refuerzo basado en referencia de modelo, que puede garantizar la convergencia y estabilidad del entrenamiento. Se diseña una función de recompensa combinada para resolver el problema de generación de trayectorias de los VANT bajo restricciones no convexas. Los resultados de la simulación muestran que, en comparación con el método tradicional de campo potencial artificial bajo diferentes condiciones de trabajo, la tasa de éxito de este método bajo restricciones no convexas se acerca al 100%, con alta precisión, convergencia y estabilidad, y tiene un mayor potencial de aplicación en el escenario de recuperación aérea, proporcionando una solución al problema de generación de trayectorias de los VANT bajo restricciones no convexas.