MixedSCNet: reconocimiento de lugares basado en LiDAR utilizando una red neuronal de contexto de escaneo multicanal
Autores: Si, Yan; Han, Wenyi; Yu, Die; Bao, Baizhong; Duan, Jian; Zhan, Xiaobin; Shi, Tielin
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
MixedSCNet: reconocimiento de lugares basado en LiDAR utilizando una red neuronal de contexto de escaneo multicanal
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Lidar
Reconocimiento de lugares
Mixedscnet
Descriptores de características
Aprendizaje profundo
Métodos híbridos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 45
Citaciones: Sin citaciones
En el ámbito de las tareas de reconocimiento de lugares basadas en LiDAR, han surgido tres metodologías predominantes: métodos basados en descriptores de características elaborados manualmente, métodos basados en aprendizaje profundo y métodos híbridos que combinan los dos anteriores. Los descriptores de características elaborados manualmente a menudo fallan en visitas inversas y entornos interiores confinados, mientras que los métodos basados en aprendizaje profundo muestran limitaciones en cuanto a la generalización a dominios de datos distintos. Los métodos híbridos tienden a solucionar estos problemas, aunque a costa de una carga computacional costosa. En respuesta a esto, este documento presenta MixedSCNet, un enfoque híbrido novedoso diseñado para aprovechar las fortalezas de los descriptores de características elaborados manualmente y los modelos de aprendizaje profundo manteniendo un costo computacional relativamente bajo. MixedSCNet comienza con la construcción de un descriptor BEV llamado MixedSC, que tiene en cuenta la altura, la intensidad y la suavidad simultáneamente, ofreciendo así una representación más completa de la nube de puntos. Posteriormente, MixedSC se introduce en una Red Neuronal Convolucional (CNN) compacta, que extrae características de alto nivel, dando como resultado un descriptor global discriminativo de la nube de puntos. Este descriptor se emplea luego para la recuperación de lugares, cerrando efectivamente la brecha entre los descriptores de características elaborados manualmente y los modelos de aprendizaje profundo. Para demostrar la eficacia de esta amalgama, llevamos a cabo una amplia gama de experimentos en los conjuntos de datos KITTI y NCLT. Los resultados muestran que MixedSCNet destaca como el único método que muestra un rendimiento de vanguardia en ambos conjuntos de datos, superando a los otros cinco métodos manteniendo al mismo tiempo un tiempo de ejecución relativamente corto.
Descripción
En el ámbito de las tareas de reconocimiento de lugares basadas en LiDAR, han surgido tres metodologías predominantes: métodos basados en descriptores de características elaborados manualmente, métodos basados en aprendizaje profundo y métodos híbridos que combinan los dos anteriores. Los descriptores de características elaborados manualmente a menudo fallan en visitas inversas y entornos interiores confinados, mientras que los métodos basados en aprendizaje profundo muestran limitaciones en cuanto a la generalización a dominios de datos distintos. Los métodos híbridos tienden a solucionar estos problemas, aunque a costa de una carga computacional costosa. En respuesta a esto, este documento presenta MixedSCNet, un enfoque híbrido novedoso diseñado para aprovechar las fortalezas de los descriptores de características elaborados manualmente y los modelos de aprendizaje profundo manteniendo un costo computacional relativamente bajo. MixedSCNet comienza con la construcción de un descriptor BEV llamado MixedSC, que tiene en cuenta la altura, la intensidad y la suavidad simultáneamente, ofreciendo así una representación más completa de la nube de puntos. Posteriormente, MixedSC se introduce en una Red Neuronal Convolucional (CNN) compacta, que extrae características de alto nivel, dando como resultado un descriptor global discriminativo de la nube de puntos. Este descriptor se emplea luego para la recuperación de lugares, cerrando efectivamente la brecha entre los descriptores de características elaborados manualmente y los modelos de aprendizaje profundo. Para demostrar la eficacia de esta amalgama, llevamos a cabo una amplia gama de experimentos en los conjuntos de datos KITTI y NCLT. Los resultados muestran que MixedSCNet destaca como el único método que muestra un rendimiento de vanguardia en ambos conjuntos de datos, superando a los otros cinco métodos manteniendo al mismo tiempo un tiempo de ejecución relativamente corto.