Exploración- y explotación impulsada por la política determinística profunda para SLAM activo en entornos interiores desconocidos
Autores: Zhao, Shengmin; Hwang, Seung-Hoon
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Exploración- y explotación impulsada por la política determinística profunda para SLAM activo en entornos interiores desconocidos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Propone
Localización y mapeo simultáneos activos
Robots
Política profunda determinista de gradientes
Algoritmo de cartógrafo
Función de recompensa
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
Este estudio propone una solución para la Localización y Mapeo Simultáneo Activo (Active SLAM) de robots en entornos interiores desconocidos utilizando una combinación de planificación de ruta con Gradiente de Política Determinista Profunda (DDPG) y el algoritmo Cartographer. Para mejorar la velocidad de convergencia de la red DDPG y minimizar las colisiones con obstáculos, ideamos una función de recompensa única que integra estrategias de exploración y explotación. La estrategia de exploración permite al robot lograr el tiempo de ejecución más corto y la trayectoria de movimiento, lo que permite un recorrido eficiente de entornos no mapeados. Además, la estrategia de explotación introduce bucles cerrados activos para mejorar la precisión del mapa. Realizamos experimentos utilizando la plataforma de simulación Gazebo para validar nuestro modelo propuesto. Los resultados experimentales demuestran que nuestro modelo supera a otros métodos de Active SLAM en la exploración y mapeo de entornos desconocidos, logrando una completitud de cuadrícula significativa del 98.7%.
Descripción
Este estudio propone una solución para la Localización y Mapeo Simultáneo Activo (Active SLAM) de robots en entornos interiores desconocidos utilizando una combinación de planificación de ruta con Gradiente de Política Determinista Profunda (DDPG) y el algoritmo Cartographer. Para mejorar la velocidad de convergencia de la red DDPG y minimizar las colisiones con obstáculos, ideamos una función de recompensa única que integra estrategias de exploración y explotación. La estrategia de exploración permite al robot lograr el tiempo de ejecución más corto y la trayectoria de movimiento, lo que permite un recorrido eficiente de entornos no mapeados. Además, la estrategia de explotación introduce bucles cerrados activos para mejorar la precisión del mapa. Realizamos experimentos utilizando la plataforma de simulación Gazebo para validar nuestro modelo propuesto. Los resultados experimentales demuestran que nuestro modelo supera a otros métodos de Active SLAM en la exploración y mapeo de entornos desconocidos, logrando una completitud de cuadrícula significativa del 98.7%.