Planificación de rutas a baja altitud basada en aprendizaje por refuerzo para enjambres de UAS en entornos de amenazas diversas
Autores: Hu, Jinwen; Fan, Liyuan; Lei, Yifei; Xu, Zhao; Fu, Wenxing; Xu, Gang
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Planificación de rutas a baja altitud basada en aprendizaje por refuerzo para enjambres de UAS en entornos de amenazas diversas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Sistemas de aeronaves no tripuladas
Decisión de maniobra autónoma
Aprendizaje por refuerzo
Planificación de rutas
Detección por radar
Formación de enjambres
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Se espera que los sistemas de aeronaves no tripuladas (UAS) con capacidades de toma de decisiones de maniobra autónoma desempeñen un papel clave en las futuras aplicaciones de sistemas no tripulados. Si bien el aprendizaje por refuerzo ha demostrado ser exitoso en la resolución de problemas de planificación de rutas de UAS en entornos urbanos simples, sigue siendo poco investigado para algunos entornos montañosos complejos. En este artículo, se estudia la planificación de rutas de enjambres de UAS para el cruce rápido a baja altitud en diversos entornos al enfrentar las amenazas de terreno complejo, radares y fallos en el enjambre. Primero, se establece una probabilidad de detección de radar de enjambres de UAS para evaluar la amenaza de detección por un sistema de radar en red, donde la probabilidad de detección de un enjambre de UAS se equipara a un solo UAS con una posición y sección transversal de radar apropiadas, denominado como el líder virtual del enjambre. En segundo lugar, se propone un método de planificación de rutas basado en aprendizaje por refuerzo para buscar la ruta óptima para el líder virtual del enjambre que equilibre la recompensa instantánea, incluida la probabilidad de detección y las restricciones de ruta, con la recompensa terminal, que incluye la tasa normal. En tercer lugar, se diseña una estrategia de optimización de formación para reducir aún más la amenaza de detección por radar mediante el ajuste dinámico de la geometría de la formación. Finalmente, se han llevado a cabo simulaciones en el entorno complejo para evaluar el rendimiento del método propuesto, donde la calidad de la ruta, la tasa de éxito de la tarea y la tasa normal se cuentan como indicadores de rendimiento.
Descripción
Se espera que los sistemas de aeronaves no tripuladas (UAS) con capacidades de toma de decisiones de maniobra autónoma desempeñen un papel clave en las futuras aplicaciones de sistemas no tripulados. Si bien el aprendizaje por refuerzo ha demostrado ser exitoso en la resolución de problemas de planificación de rutas de UAS en entornos urbanos simples, sigue siendo poco investigado para algunos entornos montañosos complejos. En este artículo, se estudia la planificación de rutas de enjambres de UAS para el cruce rápido a baja altitud en diversos entornos al enfrentar las amenazas de terreno complejo, radares y fallos en el enjambre. Primero, se establece una probabilidad de detección de radar de enjambres de UAS para evaluar la amenaza de detección por un sistema de radar en red, donde la probabilidad de detección de un enjambre de UAS se equipara a un solo UAS con una posición y sección transversal de radar apropiadas, denominado como el líder virtual del enjambre. En segundo lugar, se propone un método de planificación de rutas basado en aprendizaje por refuerzo para buscar la ruta óptima para el líder virtual del enjambre que equilibre la recompensa instantánea, incluida la probabilidad de detección y las restricciones de ruta, con la recompensa terminal, que incluye la tasa normal. En tercer lugar, se diseña una estrategia de optimización de formación para reducir aún más la amenaza de detección por radar mediante el ajuste dinámico de la geometría de la formación. Finalmente, se han llevado a cabo simulaciones en el entorno complejo para evaluar el rendimiento del método propuesto, donde la calidad de la ruta, la tasa de éxito de la tarea y la tasa normal se cuentan como indicadores de rendimiento.