TR-Net: Una Red Neuronal Basada en Transformadores para el Procesamiento de Nubes de Puntos

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

TR-Net: Una Red Neuronal Basada en Transformadores para el Procesamiento de Nubes de Puntos

Autores: Liu, Luyao; Chen, Enqing; Ding, Yingqiang

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico

2022

TR-Net: Una Red Neuronal Basada en Transformadores para el Procesamiento de Nubes de Puntos

Categoría

Tecnología de Equipos y Accesorios

Subcategoría

Diseño de equipos y herramientas

Palabras clave

Nube de puntos

Red neuronal

TR-Net

Transformador

Aprendizaje profundo

Visión por computadora

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 17

Citaciones: Sin citaciones

La nube de puntos es una representación geométrica versátil que podría aplicarse en tareas de visión por computadora. Debido al desorden de la nube de puntos, es un desafío diseñar una red neuronal profunda utilizada en el análisis de nubes de puntos. Además, la mayoría de los marcos existentes para el procesamiento de nubes de puntos apenas consideran la información de los vecinos locales o ignoran características conscientes del contexto y espaciales. Para abordar los problemas mencionados, proponemos una nueva arquitectura de procesamiento de nubes de puntos llamada TR-Net, que se basa en transformadores. Esta arquitectura reformula la tarea de procesamiento de nubes de puntos como un problema de traducción de conjunto a conjunto. TR-Net opera directamente sobre nubes de puntos en bruto sin ninguna transformación de datos o anotación, lo que reduce el consumo de recursos computacionales y el uso de memoria. En primer lugar, se diseña un backbone de incrustación de vecindario para extraer de manera efectiva la información de los vecinos locales de la nube de puntos. Luego, se construye una subred basada en atención para aprender mejor una representación semánticamente abundante y discriminativa a partir de las características incrustadas. Finalmente, se generan características globales efectivas al alimentar las características extraídas por la subred basada en atención en un backbone residual. Para diferentes tareas posteriores, construimos diferentes decodificadores. Experimentos extensos en conjuntos de datos públicos ilustran que nuestro enfoque supera a otros métodos de vanguardia. Por ejemplo, nuestro TR-Net logra un 93.1% de precisión general en el conjunto de datos ModelNet40 y el TR-Net alcanza un mIou del 85.3% en el conjunto de datos ShapeNet para la segmentación de partes.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro