Planificación de rutas a baja altitud basada en aprendizaje por refuerzo para enjambres de UAS en entornos de amenazas diversas

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Planificación de rutas a baja altitud basada en aprendizaje por refuerzo para enjambres de UAS en entornos de amenazas diversas

Autores: Hu, Jinwen; Fan, Liyuan; Lei, Yifei; Xu, Zhao; Fu, Wenxing; Xu, Gang

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico

2023

Planificación de rutas a baja altitud basada en aprendizaje por refuerzo para enjambres de UAS en entornos de amenazas diversas

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Sistemas de aeronaves no tripuladas

Decisión de maniobra autónoma

Aprendizaje por refuerzo

Planificación de rutas

Detección por radar

Formación de enjambres

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

Se espera que los sistemas de aeronaves no tripuladas (UAS) con capacidades de toma de decisiones de maniobra autónoma desempeñen un papel clave en las futuras aplicaciones de sistemas no tripulados. Si bien el aprendizaje por refuerzo ha demostrado ser exitoso en la resolución de problemas de planificación de rutas de UAS en entornos urbanos simples, sigue siendo poco investigado para algunos entornos montañosos complejos. En este artículo, se estudia la planificación de rutas de enjambres de UAS para el cruce rápido a baja altitud en diversos entornos al enfrentar las amenazas de terreno complejo, radares y fallos en el enjambre. Primero, se establece una probabilidad de detección de radar de enjambres de UAS para evaluar la amenaza de detección por un sistema de radar en red, donde la probabilidad de detección de un enjambre de UAS se equipara a un solo UAS con una posición y sección transversal de radar apropiadas, denominado como el líder virtual del enjambre. En segundo lugar, se propone un método de planificación de rutas basado en aprendizaje por refuerzo para buscar la ruta óptima para el líder virtual del enjambre que equilibre la recompensa instantánea, incluida la probabilidad de detección y las restricciones de ruta, con la recompensa terminal, que incluye la tasa normal. En tercer lugar, se diseña una estrategia de optimización de formación para reducir aún más la amenaza de detección por radar mediante el ajuste dinámico de la geometría de la formación. Finalmente, se han llevado a cabo simulaciones en el entorno complejo para evaluar el rendimiento del método propuesto, donde la calidad de la ruta, la tasa de éxito de la tarea y la tasa normal se cuentan como indicadores de rendimiento.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro