logo móvil
Contáctanos

Planificación de rutas a baja altitud basada en aprendizaje por refuerzo para enjambres de UAS en entornos de amenazas diversas

Autores: Hu, Jinwen; Fan, Liyuan; Lei, Yifei; Xu, Zhao; Fu, Wenxing; Xu, Gang

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Planificación de rutas a baja altitud basada en aprendizaje por refuerzo para enjambres de UAS en entornos de amenazas diversas


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Sistemas de aeronaves no tripuladas
Decisión de maniobra autónoma
Aprendizaje por refuerzo
Planificación de rutas
Detección por radar
Formación de enjambres

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Se espera que los sistemas de aeronaves no tripuladas (UAS) con capacidades de toma de decisiones de maniobra autónoma desempeñen un papel clave en las futuras aplicaciones de sistemas no tripulados. Si bien el aprendizaje por refuerzo ha demostrado ser exitoso en la resolución de problemas de planificación de rutas de UAS en entornos urbanos simples, sigue siendo poco investigado para algunos entornos montañosos complejos. En este artículo, se estudia la planificación de rutas de enjambres de UAS para el cruce rápido a baja altitud en diversos entornos al enfrentar las amenazas de terreno complejo, radares y fallos en el enjambre. Primero, se establece una probabilidad de detección de radar de enjambres de UAS para evaluar la amenaza de detección por un sistema de radar en red, donde la probabilidad de detección de un enjambre de UAS se equipara a un solo UAS con una posición y sección transversal de radar apropiadas, denominado como el líder virtual del enjambre. En segundo lugar, se propone un método de planificación de rutas basado en aprendizaje por refuerzo para buscar la ruta óptima para el líder virtual del enjambre que equilibre la recompensa instantánea, incluida la probabilidad de detección y las restricciones de ruta, con la recompensa terminal, que incluye la tasa normal. En tercer lugar, se diseña una estrategia de optimización de formación para reducir aún más la amenaza de detección por radar mediante el ajuste dinámico de la geometría de la formación. Finalmente, se han llevado a cabo simulaciones en el entorno complejo para evaluar el rendimiento del método propuesto, donde la calidad de la ruta, la tasa de éxito de la tarea y la tasa normal se cuentan como indicadores de rendimiento.

Otros recursos que podrían interesarte

Temas Virtualpro