Mcbm-slam: un sistema mejorado de mapeo y localización simultánea basado en redes neuronales convolucionales de región de máscara para entornos dinámicos
Autores: Wang, Xiankun; Zhang, Xinguang
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Mcbm-slam: un sistema mejorado de mapeo y localización simultánea basado en redes neuronales convolucionales de región de máscara para entornos dinámicos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Investigación
Slam
Escenarios dinámicos
Escenarios estáticos
Objetos
Algoritmo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 47
Citaciones: Sin citaciones
La investigación actual sobre SLAM se puede dividir en dos partes según el escenario de investigación: la investigación de SLAM en escenarios dinámicos y la investigación de SLAM en escenarios estáticos. La investigación está ahora relativamente bien establecida para entornos estáticos. Sin embargo, en entornos dinámicos, el impacto de los objetos en movimiento conduce a una precisión de posicionamiento inexacta y a una baja robustez de los sistemas SLAM. Para abordar las deficiencias de los sistemas SLAM en entornos dinámicos, este documento desarrolla una serie de soluciones para abordar estos problemas. En primer lugar, se utiliza una red Mask R-CNN basada en atención para garantizar la fiabilidad de la extracción de objetos dinámicos en entornos dinámicos. Luego, se rechazan los puntos de características dinámicas en función de la máscara identificada por la red Mask R-CNN, y se realiza una estimación preliminar de la pose de la cámara. En segundo lugar, para mejorar la calidad de coincidencia de imágenes y rechazar eficientemente los puntos no coincidentes, este documento propone un algoritmo de desajuste de imagen que incorpora la distancia de borde adaptativa con estadísticas de movimiento de cuadrícula. Finalmente, se vuelven a agregar puntos de características estáticas en objetos dinámicos utilizando restricciones de movimiento y pruebas de chi-cuadrado, y se vuelve a estimar la pose de la cámara. El algoritmo SLAM de este documento se ejecutó en los conjuntos de datos KITTI y TUM-RGBD, respectivamente, y los resultados muestran que el algoritmo SLAM de este documento supera al algoritmo ORB-SLAM2 para secuencias que contienen más objetos dinámicos en el conjunto de datos KITTI. En el conjunto de datos TUM-RGBD, el algoritmo Dyna-SLAM aumentó la precisión de localización en un promedio del 71,94% en comparación con el método ORB-SLAM2, mientras que el algoritmo SLAM en este estudio aumentó la precisión de localización en un promedio del 78,18% en comparación con el algoritmo ORB-SLAM2. En comparación con la técnica Dyna-SLAM, el algoritmo SLAM en este trabajo aumentó la precisión de posicionamiento promedio en un 6,24%, demostrando que es superior a Dyna-SLAM.
Descripción
La investigación actual sobre SLAM se puede dividir en dos partes según el escenario de investigación: la investigación de SLAM en escenarios dinámicos y la investigación de SLAM en escenarios estáticos. La investigación está ahora relativamente bien establecida para entornos estáticos. Sin embargo, en entornos dinámicos, el impacto de los objetos en movimiento conduce a una precisión de posicionamiento inexacta y a una baja robustez de los sistemas SLAM. Para abordar las deficiencias de los sistemas SLAM en entornos dinámicos, este documento desarrolla una serie de soluciones para abordar estos problemas. En primer lugar, se utiliza una red Mask R-CNN basada en atención para garantizar la fiabilidad de la extracción de objetos dinámicos en entornos dinámicos. Luego, se rechazan los puntos de características dinámicas en función de la máscara identificada por la red Mask R-CNN, y se realiza una estimación preliminar de la pose de la cámara. En segundo lugar, para mejorar la calidad de coincidencia de imágenes y rechazar eficientemente los puntos no coincidentes, este documento propone un algoritmo de desajuste de imagen que incorpora la distancia de borde adaptativa con estadísticas de movimiento de cuadrícula. Finalmente, se vuelven a agregar puntos de características estáticas en objetos dinámicos utilizando restricciones de movimiento y pruebas de chi-cuadrado, y se vuelve a estimar la pose de la cámara. El algoritmo SLAM de este documento se ejecutó en los conjuntos de datos KITTI y TUM-RGBD, respectivamente, y los resultados muestran que el algoritmo SLAM de este documento supera al algoritmo ORB-SLAM2 para secuencias que contienen más objetos dinámicos en el conjunto de datos KITTI. En el conjunto de datos TUM-RGBD, el algoritmo Dyna-SLAM aumentó la precisión de localización en un promedio del 71,94% en comparación con el método ORB-SLAM2, mientras que el algoritmo SLAM en este estudio aumentó la precisión de localización en un promedio del 78,18% en comparación con el algoritmo ORB-SLAM2. En comparación con la técnica Dyna-SLAM, el algoritmo SLAM en este trabajo aumentó la precisión de posicionamiento promedio en un 6,24%, demostrando que es superior a Dyna-SLAM.