PVI-Net: Fusión de Punto-Vóxel-Imagen para la Segmentación Semántica de Nubes de Puntos en Escenarios de Conducción Autónoma a Gran Escala
Autores: Wang, Zongshun; Li, Ce; Ma, Jialin; Feng, Zhiqiang; Xiao, Limei
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
PVI-Net: Fusión de Punto-Vóxel-Imagen para la Segmentación Semántica de Nubes de Puntos en Escenarios de Conducción Autónoma a Gran Escala
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Marco
Segmentación semántica
Nubes de puntos
Extracción de características
Mecanismo de atención
Métricas de rendimiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En este estudio, presentamos un nuevo marco para la segmentación semántica de nubes de puntos en escenarios de conducción autónoma, denominado PVI-Net. Este marco integra de manera única tres perspectivas de datos diferentes: nubes de puntos, vóxeles y mapas de distancia, ejecutando la extracción de características a través de tres ramas paralelas. A lo largo de este proceso, diseñamos ingeniosamente un mecanismo de atención cruzada entre nubes de puntos y vóxeles, así como una estrategia de fusión de características multiperspectiva para imágenes de puntos. Estas estrategias facilitan la interacción de información a través de diferentes dimensiones de características de las perspectivas, optimizando así la fusión de información desde varios puntos de vista y mejorando significativamente el rendimiento general del modelo. La red emplea una estructura U-Net y conexiones residuales, fusionando y codificando efectivamente la información para mejorar la precisión y eficiencia de la segmentación semántica. Validamos el rendimiento de PVI-Net en los conjuntos de datos SemanticKITTI y nuScenes. Los resultados demuestran que PVI-Net supera la mayoría de los métodos anteriores en varias métricas de rendimiento.
Descripción
En este estudio, presentamos un nuevo marco para la segmentación semántica de nubes de puntos en escenarios de conducción autónoma, denominado PVI-Net. Este marco integra de manera única tres perspectivas de datos diferentes: nubes de puntos, vóxeles y mapas de distancia, ejecutando la extracción de características a través de tres ramas paralelas. A lo largo de este proceso, diseñamos ingeniosamente un mecanismo de atención cruzada entre nubes de puntos y vóxeles, así como una estrategia de fusión de características multiperspectiva para imágenes de puntos. Estas estrategias facilitan la interacción de información a través de diferentes dimensiones de características de las perspectivas, optimizando así la fusión de información desde varios puntos de vista y mejorando significativamente el rendimiento general del modelo. La red emplea una estructura U-Net y conexiones residuales, fusionando y codificando efectivamente la información para mejorar la precisión y eficiencia de la segmentación semántica. Validamos el rendimiento de PVI-Net en los conjuntos de datos SemanticKITTI y nuScenes. Los resultados demuestran que PVI-Net supera la mayoría de los métodos anteriores en varias métricas de rendimiento.