Point-Sim: una red ligera para la clasificación de nubes de puntos en 3D
Autores: Guo, Jiachen; Luo, Wenjie
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Point-Sim: una red ligera para la clasificación de nubes de puntos en 3D
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Nubes de puntos
Redes neuronales
Enfoque no paramétrico
Análisis de nube de puntos en 3D
Extracción de características
Parámetros entrenables
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 42
Citaciones: Sin citaciones
Analizar nubes de puntos con redes neuronales es un tema de investigación actual. Con el fin de analizar las características geométricas en 3D de las nubes de puntos, la mayoría de las redes neuronales mejoran el rendimiento de la red mediante la adición de operadores geométricos locales y parámetros entrenables. Sin embargo, el aprendizaje profundo suele requerir una gran cantidad de recursos computacionales para el entrenamiento y la inferencia, lo que plantea desafíos para los dispositivos de hardware y el consumo de energía. Por lo tanto, algunos investigadores han comenzado a intentar utilizar un enfoque no paramétrico para extraer características. Point-NN combina módulos no paramétricos para construir una red no paramétrica para el análisis de nubes de puntos en 3D, y los componentes no paramétricos incluyen operaciones como incrustación trigonométrica, muestreo de punto más lejano (FPS), vecino más cercano (k-NN) y agrupación. Sin embargo, Point-NN tiene cierta ceguera en la incrustación de características al utilizar la función trigonométrica durante la extracción de características. Para eliminar esta ceguera lo máximo posible, utilizamos un mecanismo de atención basado en una función de energía no paramétrica (ResSimAM). Las características incrustadas se mejoran calculando la energía de las características mediante la función de energía, y luego se utiliza ResSimAM para mejorar los pesos de las características incrustadas por la energía para mejorar las características sin agregar parámetros adicionales a la red original; Point-NN necesita calcular la similitud entre cada característica en la etapa de coincidencia de similitud de características ingenua; sin embargo, la diferencia de magnitud de las características en el espacio vectorial durante la etapa de extracción de características puede afectar el resultado final de la coincidencia. Utilizamos la operación Squash para comprimir las características. Esta operación no lineal puede hacer que las características se compriman a un cierto rango sin cambiar la dirección original en el espacio vectorial, eliminando así el efecto de la magnitud de la característica, y finalmente podemos completar mejor la coincidencia de características ingenua en el espacio vectorial. Insertamos estos módulos en la red y construimos una red no paramétrica, Point-Sim, que funciona bien en tareas de clasificación en 3D. Basándonos en esto, extendemos la red neuronal ligera Point-SimP agregando algunos parámetros entrenables para la tarea de clasificación de nubes de puntos, que requiere solo 0.8 M de parámetros para un análisis de alto rendimiento. Los resultados experimentales demuestran la efectividad de nuestro algoritmo propuesto en la tarea de clasificación de formas de nubes de puntos. Los resultados correspondientes en ModelNet40 y ScanObjectNN son del 83.9% y 66.3% para 0 M de parámetros, sin ningún entrenamiento, y del 93.3% y 86.6% para 0.8 M de parámetros. Point-SimP alcanza una velocidad de prueba de 962 muestras por segundo en el conjunto de datos ModelNet40. Los resultados experimentales muestran que nuestro método propuesto mejora efectivamente el rendimiento en las redes de clasificación de nubes de puntos.
Descripción
Analizar nubes de puntos con redes neuronales es un tema de investigación actual. Con el fin de analizar las características geométricas en 3D de las nubes de puntos, la mayoría de las redes neuronales mejoran el rendimiento de la red mediante la adición de operadores geométricos locales y parámetros entrenables. Sin embargo, el aprendizaje profundo suele requerir una gran cantidad de recursos computacionales para el entrenamiento y la inferencia, lo que plantea desafíos para los dispositivos de hardware y el consumo de energía. Por lo tanto, algunos investigadores han comenzado a intentar utilizar un enfoque no paramétrico para extraer características. Point-NN combina módulos no paramétricos para construir una red no paramétrica para el análisis de nubes de puntos en 3D, y los componentes no paramétricos incluyen operaciones como incrustación trigonométrica, muestreo de punto más lejano (FPS), vecino más cercano (k-NN) y agrupación. Sin embargo, Point-NN tiene cierta ceguera en la incrustación de características al utilizar la función trigonométrica durante la extracción de características. Para eliminar esta ceguera lo máximo posible, utilizamos un mecanismo de atención basado en una función de energía no paramétrica (ResSimAM). Las características incrustadas se mejoran calculando la energía de las características mediante la función de energía, y luego se utiliza ResSimAM para mejorar los pesos de las características incrustadas por la energía para mejorar las características sin agregar parámetros adicionales a la red original; Point-NN necesita calcular la similitud entre cada característica en la etapa de coincidencia de similitud de características ingenua; sin embargo, la diferencia de magnitud de las características en el espacio vectorial durante la etapa de extracción de características puede afectar el resultado final de la coincidencia. Utilizamos la operación Squash para comprimir las características. Esta operación no lineal puede hacer que las características se compriman a un cierto rango sin cambiar la dirección original en el espacio vectorial, eliminando así el efecto de la magnitud de la característica, y finalmente podemos completar mejor la coincidencia de características ingenua en el espacio vectorial. Insertamos estos módulos en la red y construimos una red no paramétrica, Point-Sim, que funciona bien en tareas de clasificación en 3D. Basándonos en esto, extendemos la red neuronal ligera Point-SimP agregando algunos parámetros entrenables para la tarea de clasificación de nubes de puntos, que requiere solo 0.8 M de parámetros para un análisis de alto rendimiento. Los resultados experimentales demuestran la efectividad de nuestro algoritmo propuesto en la tarea de clasificación de formas de nubes de puntos. Los resultados correspondientes en ModelNet40 y ScanObjectNN son del 83.9% y 66.3% para 0 M de parámetros, sin ningún entrenamiento, y del 93.3% y 86.6% para 0.8 M de parámetros. Point-SimP alcanza una velocidad de prueba de 962 muestras por segundo en el conjunto de datos ModelNet40. Los resultados experimentales muestran que nuestro método propuesto mejora efectivamente el rendimiento en las redes de clasificación de nubes de puntos.