Planificación de ruta de persecución para múltiples vehículos terrestres no tripulados basada en aprendizaje profundo por refuerzo

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Planificación de ruta de persecución para múltiples vehículos terrestres no tripulados basada en aprendizaje profundo por refuerzo

Autores: Guo, Hongda; Xu, Youchun; Ma, Yulin; Xu, Shucai; Li, Zhixiong

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico

2023

Planificación de ruta de persecución para múltiples vehículos terrestres no tripulados basada en aprendizaje profundo por refuerzo

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Planificación de rutas

Tareas de persecución

Vehículos terrestres no tripulados

Descenso de gradiente

Aprendizaje profundo por refuerzo

Evasión de obstáculos

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 49

Citaciones: Sin citaciones

La planificación de rutas juega un papel crucial en la ejecución de tareas de persecución para múltiples vehículos terrestres no tripulados (multi-UGVs). Aunque los métodos populares de planificación de rutas existentes pueden lograr los objetivos de persecución, sufren de algunas desventajas como un largo tiempo de computación y puntos de inflexión de ruta excesivos. Para abordar estos problemas, este documento combina el descenso de gradiente y el aprendizaje profundo por refuerzo (DRL) para resolver el problema de puntos de inflexión de ruta excesivos desde una perspectiva de suavizado de ruta. Además, se incorpora el método de repetición de experiencia priorizada (PER) para mejorar la eficiencia de aprendizaje de DRL. De esta manera, el modelo propuesto integra PER, descenso de gradiente y una red de aprendizaje profundo de doble Q-learning de múltiples agentes (PER-GDMADDQN) para habilitar la planificación de rutas y capacidades de evasión de obstáculos de multi-UGVs. Los resultados experimentales demuestran que el propuesto PER-GDMADDQN produce un rendimiento superior en el problema de persecución de multi-UGVs, donde la velocidad de entrenamiento y la suavidad del método propuesto superan a otros algoritmos populares. Como resultado, el método propuesto permite una planificación de rutas satisfactoria para multi-UGVs.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro