Múltiple Algoritmo de Planificación de Trayectoria Autónoma de Vehículos Aéreos No Tripulados Basado en Red Profunda Q Inspirada en Ballenas
Autores: Wang, Wenshan; Zhang, Guoyin; Da, Qingan; Lu, Dan; Zhao, Yingnan; Li, Sizhao; Lang, Dapeng
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Múltiple Algoritmo de Planificación de Trayectoria Autónoma de Vehículos Aéreos No Tripulados Basado en Red Profunda Q Inspirada en Ballenas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Uavs
Planificación de rutas
Algoritmo de optimización de ballenas
Red profunda de Q
Entorno incierto
Misiones de rescate
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En misiones de rescate de emergencia, los equipos de rescate pueden utilizar UAVs y estrategias de planificación de rutas eficientes para proporcionar servicios de rescate flexibles para personas atrapadas, lo que puede mejorar la eficiencia del rescate y reducir los riesgos para el personal. Sin embargo, dado que el entorno de tarea de los UAVs suele ser complejo, incierto y con limitaciones de comunicación, los métodos tradicionales de planificación de rutas pueden no ser capaces de satisfacer las necesidades prácticas. En este artículo, introducimos un algoritmo de optimización de ballenas en una red Q profunda y proponemos un algoritmo de planificación de rutas basado en una red Q profunda inspirada en ballenas, que permite a los UAVs buscar objetivos de manera más rápida y segura en entornos inciertos y complejos. En particular, primero transformamos el problema de planificación de rutas de los UAVs en un proceso de decisión de Markov. Luego, diseñamos una función de recompensa integral considerando los tres factores de longitud de ruta, evitación de obstáculos y consumo de energía. A continuación, utilizamos el marco principal de la red Q profunda para aproximar la función de valor Q entrenando una red neuronal profunda. Durante la fase de entrenamiento, se introduce el algoritmo de optimización de ballenas para la exploración de rutas con el fin de generar una experiencia de decisión de acción más rica. Finalmente, los experimentos muestran que el algoritmo propuesto puede permitir que el UAV planifique de manera autónoma una ruta factible sin colisiones en un entorno incierto. Y en comparación con los algoritmos clásicos de aprendizaje por refuerzo, el algoritmo propuesto tiene un mejor rendimiento en eficiencia de aprendizaje, tasa de éxito en la planificación de rutas y longitud de ruta.
Descripción
En misiones de rescate de emergencia, los equipos de rescate pueden utilizar UAVs y estrategias de planificación de rutas eficientes para proporcionar servicios de rescate flexibles para personas atrapadas, lo que puede mejorar la eficiencia del rescate y reducir los riesgos para el personal. Sin embargo, dado que el entorno de tarea de los UAVs suele ser complejo, incierto y con limitaciones de comunicación, los métodos tradicionales de planificación de rutas pueden no ser capaces de satisfacer las necesidades prácticas. En este artículo, introducimos un algoritmo de optimización de ballenas en una red Q profunda y proponemos un algoritmo de planificación de rutas basado en una red Q profunda inspirada en ballenas, que permite a los UAVs buscar objetivos de manera más rápida y segura en entornos inciertos y complejos. En particular, primero transformamos el problema de planificación de rutas de los UAVs en un proceso de decisión de Markov. Luego, diseñamos una función de recompensa integral considerando los tres factores de longitud de ruta, evitación de obstáculos y consumo de energía. A continuación, utilizamos el marco principal de la red Q profunda para aproximar la función de valor Q entrenando una red neuronal profunda. Durante la fase de entrenamiento, se introduce el algoritmo de optimización de ballenas para la exploración de rutas con el fin de generar una experiencia de decisión de acción más rica. Finalmente, los experimentos muestran que el algoritmo propuesto puede permitir que el UAV planifique de manera autónoma una ruta factible sin colisiones en un entorno incierto. Y en comparación con los algoritmos clásicos de aprendizaje por refuerzo, el algoritmo propuesto tiene un mejor rendimiento en eficiencia de aprendizaje, tasa de éxito en la planificación de rutas y longitud de ruta.