Vid-SLAM: estimación robusta de pose con entrada RGBD-inercial para localización robótica en interiores
Autores: Shan, Dan; Su, Jinhe; Wang, Xiaofeng; Liu, Yujun; Zhou, Taojian; Wu, Zebiao
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Vid-SLAM: estimación robusta de pose con entrada RGBD-inercial para localización robótica en interiores
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Estudio
Odometría visual-inercial de profundidad
Marco SLAM
RGB-D
Medidas de IMU
Precisión de posicionamiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
Este estudio propone un marco de Localización y Mapeo Simultáneo (SLAM) multi-sensor estrechamente acoplado que integra medidas RGB-D e inerciales para lograr una localización métrica altamente precisa de 6 grados de libertad (6DOF) en una variedad de entornos. A través de la consideración de la consistencia geométrica, las restricciones de la unidad de medida inercial y los errores de reproyección visual, presentamos odometría visual-inercial en profundidad (llamada VIDO), un eficiente backend de estimación de estado, para minimizar las pérdidas en cascada de todos los factores. Los odómetros visuales-inerciales existentes se basan en restricciones basadas en características visuales para eliminar el desplazamiento translacional y la deriva angular producida por el ruido de la Unidad de Medida Inercial (IMU). Para mitigar estas restricciones, introducimos el error de punto más cercano iterativo de cuadros adyacentes y actualizamos los vectores de estado de cuadros observados a través de la minimización de los errores de estimación de todos los sensores. Además, el módulo de bucle cerrado permite una mayor optimización del mapa de actitud global para corregir la deriva a largo plazo. Para experimentos, recopilamos un conjunto de datos RGBD-inercial para una evaluación integral de VID-SLAM. El conjunto de datos contiene pares de imágenes RGB-D, medidas IMU y dos tipos de datos de verdad terreno. Los resultados experimentales muestran que VID-SLAM logra una precisión de posicionamiento de vanguardia y supera a las soluciones vSLAM convencionales, incluidas ElasticFusion, ORB-SLAM2 y VINS-Mono.
Descripción
Este estudio propone un marco de Localización y Mapeo Simultáneo (SLAM) multi-sensor estrechamente acoplado que integra medidas RGB-D e inerciales para lograr una localización métrica altamente precisa de 6 grados de libertad (6DOF) en una variedad de entornos. A través de la consideración de la consistencia geométrica, las restricciones de la unidad de medida inercial y los errores de reproyección visual, presentamos odometría visual-inercial en profundidad (llamada VIDO), un eficiente backend de estimación de estado, para minimizar las pérdidas en cascada de todos los factores. Los odómetros visuales-inerciales existentes se basan en restricciones basadas en características visuales para eliminar el desplazamiento translacional y la deriva angular producida por el ruido de la Unidad de Medida Inercial (IMU). Para mitigar estas restricciones, introducimos el error de punto más cercano iterativo de cuadros adyacentes y actualizamos los vectores de estado de cuadros observados a través de la minimización de los errores de estimación de todos los sensores. Además, el módulo de bucle cerrado permite una mayor optimización del mapa de actitud global para corregir la deriva a largo plazo. Para experimentos, recopilamos un conjunto de datos RGBD-inercial para una evaluación integral de VID-SLAM. El conjunto de datos contiene pares de imágenes RGB-D, medidas IMU y dos tipos de datos de verdad terreno. Los resultados experimentales muestran que VID-SLAM logra una precisión de posicionamiento de vanguardia y supera a las soluciones vSLAM convencionales, incluidas ElasticFusion, ORB-SLAM2 y VINS-Mono.