Planificación de ruta de persecución para múltiples vehículos terrestres no tripulados basada en aprendizaje profundo por refuerzo
Autores: Guo, Hongda; Xu, Youchun; Ma, Yulin; Xu, Shucai; Li, Zhixiong
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Planificación de ruta de persecución para múltiples vehículos terrestres no tripulados basada en aprendizaje profundo por refuerzo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Planificación de rutas
Tareas de persecución
Vehículos terrestres no tripulados
Descenso de gradiente
Aprendizaje profundo por refuerzo
Evasión de obstáculos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 49
Citaciones: Sin citaciones
La planificación de rutas juega un papel crucial en la ejecución de tareas de persecución para múltiples vehículos terrestres no tripulados (multi-UGVs). Aunque los métodos populares de planificación de rutas existentes pueden lograr los objetivos de persecución, sufren de algunas desventajas como un largo tiempo de computación y puntos de inflexión de ruta excesivos. Para abordar estos problemas, este documento combina el descenso de gradiente y el aprendizaje profundo por refuerzo (DRL) para resolver el problema de puntos de inflexión de ruta excesivos desde una perspectiva de suavizado de ruta. Además, se incorpora el método de repetición de experiencia priorizada (PER) para mejorar la eficiencia de aprendizaje de DRL. De esta manera, el modelo propuesto integra PER, descenso de gradiente y una red de aprendizaje profundo de doble Q-learning de múltiples agentes (PER-GDMADDQN) para habilitar la planificación de rutas y capacidades de evasión de obstáculos de multi-UGVs. Los resultados experimentales demuestran que el propuesto PER-GDMADDQN produce un rendimiento superior en el problema de persecución de multi-UGVs, donde la velocidad de entrenamiento y la suavidad del método propuesto superan a otros algoritmos populares. Como resultado, el método propuesto permite una planificación de rutas satisfactoria para multi-UGVs.
Descripción
La planificación de rutas juega un papel crucial en la ejecución de tareas de persecución para múltiples vehículos terrestres no tripulados (multi-UGVs). Aunque los métodos populares de planificación de rutas existentes pueden lograr los objetivos de persecución, sufren de algunas desventajas como un largo tiempo de computación y puntos de inflexión de ruta excesivos. Para abordar estos problemas, este documento combina el descenso de gradiente y el aprendizaje profundo por refuerzo (DRL) para resolver el problema de puntos de inflexión de ruta excesivos desde una perspectiva de suavizado de ruta. Además, se incorpora el método de repetición de experiencia priorizada (PER) para mejorar la eficiencia de aprendizaje de DRL. De esta manera, el modelo propuesto integra PER, descenso de gradiente y una red de aprendizaje profundo de doble Q-learning de múltiples agentes (PER-GDMADDQN) para habilitar la planificación de rutas y capacidades de evasión de obstáculos de multi-UGVs. Los resultados experimentales demuestran que el propuesto PER-GDMADDQN produce un rendimiento superior en el problema de persecución de multi-UGVs, donde la velocidad de entrenamiento y la suavidad del método propuesto superan a otros algoritmos populares. Como resultado, el método propuesto permite una planificación de rutas satisfactoria para multi-UGVs.