Un marco de odometría basado en atención para vehículos terrestres no tripulados (UGVs) multisensoriales
Autores: Xiao, Zhiyao; Zhang, Guobao
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un marco de odometría basado en atención para vehículos terrestres no tripulados (UGVs) multisensoriales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Aprendizaje profundo
Fusión multisensorial
Desafíos de odometría
Marco visual-lidar-inercial
Red neuronal convolucional
Red neuronal recurrente
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Recientemente, se han aplicado métodos de aprendizaje profundo y fusión multisensorial para abordar los desafíos de odometría en vehículos terrestres no tripulados (UGVs). En este artículo, proponemos un marco de odometría visual-lidar-inercial de extremo a extremo para mejorar la precisión de la estimación de pose. Se utilizan imágenes en escala de grises, nubes de puntos 3D y datos inerciales como entradas para superar las limitaciones de un solo sensor. Se emplean redes neuronales convolucionales (CNN) y redes neuronales recurrentes (RNN) como codificadores para diferentes modalidades de sensores. A diferencia de los métodos de odometría multisensorial anteriores, nuestro marco introduce un novedoso módulo de fusión basado en atención que remapea vectores de características para adaptarse a diversas escenas. Las evaluaciones en el banco de pruebas de odometría del Instituto de Tecnología de Karlsruhe y del Instituto Tecnológico de Toyota en Chicago (KITTI) demuestran la efectividad de nuestro marco.
Descripción
Recientemente, se han aplicado métodos de aprendizaje profundo y fusión multisensorial para abordar los desafíos de odometría en vehículos terrestres no tripulados (UGVs). En este artículo, proponemos un marco de odometría visual-lidar-inercial de extremo a extremo para mejorar la precisión de la estimación de pose. Se utilizan imágenes en escala de grises, nubes de puntos 3D y datos inerciales como entradas para superar las limitaciones de un solo sensor. Se emplean redes neuronales convolucionales (CNN) y redes neuronales recurrentes (RNN) como codificadores para diferentes modalidades de sensores. A diferencia de los métodos de odometría multisensorial anteriores, nuestro marco introduce un novedoso módulo de fusión basado en atención que remapea vectores de características para adaptarse a diversas escenas. Las evaluaciones en el banco de pruebas de odometría del Instituto de Tecnología de Karlsruhe y del Instituto Tecnológico de Toyota en Chicago (KITTI) demuestran la efectividad de nuestro marco.