logo móvil
Contáctanos

TR-Net: Una Red Neuronal Basada en Transformadores para el Procesamiento de Nubes de Puntos

Autores: Liu, Luyao; Chen, Enqing; Ding, Yingqiang

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

TR-Net: Una Red Neuronal Basada en Transformadores para el Procesamiento de Nubes de Puntos


Categoría

Tecnología de Equipos y Accesorios

Subcategoría

Diseño de equipos y herramientas

Palabras clave

Nube de puntos
Red neuronal
TR-Net
Transformador
Aprendizaje profundo
Visión por computadora

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 17

Citaciones: Sin citaciones


Descripción
La nube de puntos es una representación geométrica versátil que podría aplicarse en tareas de visión por computadora. Debido al desorden de la nube de puntos, es un desafío diseñar una red neuronal profunda utilizada en el análisis de nubes de puntos. Además, la mayoría de los marcos existentes para el procesamiento de nubes de puntos apenas consideran la información de los vecinos locales o ignoran características conscientes del contexto y espaciales. Para abordar los problemas mencionados, proponemos una nueva arquitectura de procesamiento de nubes de puntos llamada TR-Net, que se basa en transformadores. Esta arquitectura reformula la tarea de procesamiento de nubes de puntos como un problema de traducción de conjunto a conjunto. TR-Net opera directamente sobre nubes de puntos en bruto sin ninguna transformación de datos o anotación, lo que reduce el consumo de recursos computacionales y el uso de memoria. En primer lugar, se diseña un backbone de incrustación de vecindario para extraer de manera efectiva la información de los vecinos locales de la nube de puntos. Luego, se construye una subred basada en atención para aprender mejor una representación semánticamente abundante y discriminativa a partir de las características incrustadas. Finalmente, se generan características globales efectivas al alimentar las características extraídas por la subred basada en atención en un backbone residual. Para diferentes tareas posteriores, construimos diferentes decodificadores. Experimentos extensos en conjuntos de datos públicos ilustran que nuestro enfoque supera a otros métodos de vanguardia. Por ejemplo, nuestro TR-Net logra un 93.1% de precisión general en el conjunto de datos ModelNet40 y el TR-Net alcanza un mIou del 85.3% en el conjunto de datos ShapeNet para la segmentación de partes.

Otros recursos que podrían interesarte

Temas Virtualpro