Mapeo Visual Denso en Tiempo Real con Representación de Factores Neurales
Autores: Wei, Weifeng; Wang, Jie; Xie, Xiaolong; Liu, Jie; Su, Pengxiang
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Mapeo Visual Denso en Tiempo Real con Representación de Factores Neurales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Representación implícita neural
SLAM visual
Reconstrucción en tiempo real
Representación de escena neural
Renderizado de integración de características
Regiones de detalle de alta frecuencia
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 50
Citaciones: Sin citaciones
Desarrollar un sistema SLAM visual denso en tiempo real de alta calidad plantea un desafío significativo en el campo de la visión por computadora. NeRF introduce una representación implícita neuronal, marcando un avance notable en la investigación de SLAM visual. Sin embargo, los métodos de SLAM implícito neuronal existentes sufren de largos tiempos de ejecución y enfrentan desafíos al modelar estructuras complejas en escenas. En este documento, proponemos un método de SLAM visual denso implícito neuronal que permite una reconstrucción en tiempo real de alta calidad incluso en una PC de escritorio. En primer lugar, proponemos una representación novedosa de la escena neuronal, codificando la información de geometría y apariencia de la escena como una combinación de factores de base y coeficientes. Esta representación permite un uso eficiente de la memoria y la modelización precisa de regiones de detalle de alta frecuencia. En segundo lugar, introducimos la renderización de integración de características para mejorar significativamente la velocidad de renderizado manteniendo la calidad del renderizado de color. Experimentos extensos en conjuntos de datos sintéticos y del mundo real demuestran que nuestro método logra una mejora promedio de más del 60% para Depth L1 y ATE RMSE en comparación con los métodos actuales de vanguardia cuando se ejecuta a 9.8 Hz en una PC de escritorio con un CPU Intel Core i9-12900K de 3.20 GHz y una GPU NVIDIA RTX 3090. Este avance notable destaca la importancia crucial de nuestro enfoque en el campo de SLAM visual denso.
Descripción
Desarrollar un sistema SLAM visual denso en tiempo real de alta calidad plantea un desafío significativo en el campo de la visión por computadora. NeRF introduce una representación implícita neuronal, marcando un avance notable en la investigación de SLAM visual. Sin embargo, los métodos de SLAM implícito neuronal existentes sufren de largos tiempos de ejecución y enfrentan desafíos al modelar estructuras complejas en escenas. En este documento, proponemos un método de SLAM visual denso implícito neuronal que permite una reconstrucción en tiempo real de alta calidad incluso en una PC de escritorio. En primer lugar, proponemos una representación novedosa de la escena neuronal, codificando la información de geometría y apariencia de la escena como una combinación de factores de base y coeficientes. Esta representación permite un uso eficiente de la memoria y la modelización precisa de regiones de detalle de alta frecuencia. En segundo lugar, introducimos la renderización de integración de características para mejorar significativamente la velocidad de renderizado manteniendo la calidad del renderizado de color. Experimentos extensos en conjuntos de datos sintéticos y del mundo real demuestran que nuestro método logra una mejora promedio de más del 60% para Depth L1 y ATE RMSE en comparación con los métodos actuales de vanguardia cuando se ejecuta a 9.8 Hz en una PC de escritorio con un CPU Intel Core i9-12900K de 3.20 GHz y una GPU NVIDIA RTX 3090. Este avance notable destaca la importancia crucial de nuestro enfoque en el campo de SLAM visual denso.