Red Transformadora Local en Segmentación Semántica de Nubes de Puntos 3D
Autores: Wang, Zijun; Wang, Yun; An, Lifeng; Liu, Jian; Liu, Haiyang
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Red Transformadora Local en Segmentación Semántica de Nubes de Puntos 3D
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Segmentación semántica
Nube de puntos 3D
Estructura de transformador local
Matrices de pesos de atención
Selección cruzada
Precisiones de segmentación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La segmentación semántica es un componente importante para entender la escena de nubes de puntos 3D. La capacidad de obtener información contextual local y global de los puntos es de gran importancia para mejorar el rendimiento de la segmentación semántica de nubes de puntos 3D. En este artículo, proponemos un módulo de extracción de características de autoatención: la estructura de transformador local. Al apilar la capa de codificador compuesta por esta estructura, podemos extraer características locales mientras preservamos la conectividad global. La estructura puede aprender automáticamente cada característica de punto de sus vecindarios y es invariante a diferentes órdenes de puntos. Diseñamos dos matrices clave únicas, cada una de las cuales se centra en las similitudes de características y las relaciones de estructura geométrica entre los puntos para generar matrices de pesos de atención. Además, se utiliza la selección de vecinos cruzados para obtener campos receptivos más grandes para cada punto sin aumentar el número de cálculos requeridos, y por lo tanto puede manejar mejor la unión entre múltiples objetos. Cuando se verificó la nueva red en el S3DIS, la intersección media sobre la unión fue del 69.1%, y las precisiones de segmentación en los conjuntos de datos de escenas exteriores complejas Semantic3D y SemanticKITTI fueron del 94.3% y 87.8%, respectivamente, lo que demuestra la efectividad de los métodos propuestos.
Descripción
La segmentación semántica es un componente importante para entender la escena de nubes de puntos 3D. La capacidad de obtener información contextual local y global de los puntos es de gran importancia para mejorar el rendimiento de la segmentación semántica de nubes de puntos 3D. En este artículo, proponemos un módulo de extracción de características de autoatención: la estructura de transformador local. Al apilar la capa de codificador compuesta por esta estructura, podemos extraer características locales mientras preservamos la conectividad global. La estructura puede aprender automáticamente cada característica de punto de sus vecindarios y es invariante a diferentes órdenes de puntos. Diseñamos dos matrices clave únicas, cada una de las cuales se centra en las similitudes de características y las relaciones de estructura geométrica entre los puntos para generar matrices de pesos de atención. Además, se utiliza la selección de vecinos cruzados para obtener campos receptivos más grandes para cada punto sin aumentar el número de cálculos requeridos, y por lo tanto puede manejar mejor la unión entre múltiples objetos. Cuando se verificó la nueva red en el S3DIS, la intersección media sobre la unión fue del 69.1%, y las precisiones de segmentación en los conjuntos de datos de escenas exteriores complejas Semantic3D y SemanticKITTI fueron del 94.3% y 87.8%, respectivamente, lo que demuestra la efectividad de los métodos propuestos.