logo móvil
Contáctanos

Planificación de ruta de persecución para múltiples vehículos terrestres no tripulados basada en aprendizaje profundo por refuerzo

Autores: Guo, Hongda; Xu, Youchun; Ma, Yulin; Xu, Shucai; Li, Zhixiong

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Planificación de ruta de persecución para múltiples vehículos terrestres no tripulados basada en aprendizaje profundo por refuerzo


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Planificación de rutas
Tareas de persecución
Vehículos terrestres no tripulados
Descenso de gradiente
Aprendizaje profundo por refuerzo
Evasión de obstáculos

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 49

Citaciones: Sin citaciones


Descripción
La planificación de rutas juega un papel crucial en la ejecución de tareas de persecución para múltiples vehículos terrestres no tripulados (multi-UGVs). Aunque los métodos populares de planificación de rutas existentes pueden lograr los objetivos de persecución, sufren de algunas desventajas como un largo tiempo de computación y puntos de inflexión de ruta excesivos. Para abordar estos problemas, este documento combina el descenso de gradiente y el aprendizaje profundo por refuerzo (DRL) para resolver el problema de puntos de inflexión de ruta excesivos desde una perspectiva de suavizado de ruta. Además, se incorpora el método de repetición de experiencia priorizada (PER) para mejorar la eficiencia de aprendizaje de DRL. De esta manera, el modelo propuesto integra PER, descenso de gradiente y una red de aprendizaje profundo de doble Q-learning de múltiples agentes (PER-GDMADDQN) para habilitar la planificación de rutas y capacidades de evasión de obstáculos de multi-UGVs. Los resultados experimentales demuestran que el propuesto PER-GDMADDQN produce un rendimiento superior en el problema de persecución de multi-UGVs, donde la velocidad de entrenamiento y la suavidad del método propuesto superan a otros algoritmos populares. Como resultado, el método propuesto permite una planificación de rutas satisfactoria para multi-UGVs.

Otros recursos que podrían interesarte

Temas Virtualpro