Formación Cooperativa Distribuida y Escalable de Vehículos Terrestres No Tripulados Usando Aprendizaje por Refuerzo Profundo

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Formación Cooperativa Distribuida y Escalable de Vehículos Terrestres No Tripulados Usando Aprendizaje por Refuerzo Profundo

Autores: Huang, Shichun; Wang, Tao; Tang, Yong; Hu, Yiwen; Xin, Gu; Zhou, Dianle

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico

2023

Formación Cooperativa Distribuida y Escalable de Vehículos Terrestres No Tripulados Usando Aprendizaje por Refuerzo Profundo

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Aeroespacial

Palabras clave

Control de formación cooperativa

Vehículos terrestres no tripulados

Algoritmos basados en aprendizaje por refuerzo

Control de formación en tiempo real

Algoritmo distribuido basado en aprendizaje profundo por refuerzo

Estructura de formación triangular jerárquica

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 19

Citaciones: Sin citaciones

El control de formación cooperativa de vehículos terrestres no tripulados (UGVs) se ha convertido en uno de los importantes focos de investigación en la aplicación de UGV y ha atraído cada vez más atención en los campos militar y civil. En comparación con los algoritmos tradicionales de control de formación, los algoritmos basados en aprendizaje por refuerzo pueden proporcionar una nueva solución con una complejidad menor para el control de formación en tiempo real al equipar a los UGV con inteligencia artificial. Por lo tanto, en este artículo, se propone un algoritmo de control de formación cooperativa basado en aprendizaje profundo por refuerzo distribuido para resolver las tareas de navegación, mantenimiento y evitación de obstáculos de las formaciones de UGV. Más importante aún, la estructura de formación triangular jerárquica y el proceso de decisión de Markov recién diseñado para las formaciones de UGV con atributos de líder y seguidor hacen que la estrategia de control aprendida por el algoritmo sea reutilizable, de modo que la formación pueda aumentar arbitrariamente el número de UGV y realizar una expansión más flexible. La efectividad y escalabilidad del algoritmo se verifica mediante experimentos de simulación de formación de diferentes escalas.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro