logo móvil
Contáctanos

NRAP-RCNN: Un método de detección de objetos 3D basado en nubes de puntos pseudo, reducción de ruido, convolución dispersa y mecanismo de atención

Autores: Zhou, Ziyue; Jia, Yongqing; Zhu, Tao; Wan, Yaping

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

NRAP-RCNN: Un método de detección de objetos 3D basado en nubes de puntos pseudo, reducción de ruido, convolución dispersa y mecanismo de atención


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Nubes de puntos pseudo
Detección de objetos en 3D
NRAP-RCNN
Reducción de ruido
Red de convolución dispersa
Información contextual global

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
En los últimos años, las nubes de puntos pseudo generadas a partir de la finalización de profundidad de imágenes RGB y datos LiDAR han proporcionado una base sólida para la detección de objetos 3D multimodal. Sin embargo, el proceso de generación a menudo introduce ruido, reduciendo la calidad de los datos y la precisión de la detección. Además, los métodos existentes no logran capturar de manera efectiva las correlaciones de canal y la información contextual global durante la etapa de extracción de características 2D después de la red de backbone 3D, limitando el rendimiento de detección. Para abordar estos desafíos, este documento propone NRAP-RCNN, un método de detección de objetos 3D basado en nubes de puntos pseudo con dos innovaciones clave: (1) Una red de convolución dispersa de reducción de ruido (NRConvNet), que comprende NRConv (convolución dispersa submanifold resistente al ruido), SRB (bloque residual de convolución dispersa) y MHSA (atención propia de múltiples cabezas). NRConv suprime el ruido de la nube de puntos pseudo al codificar conjuntamente características 2D y 3D, SRB mejora la profundidad y robustez de la extracción de características, y MHSA optimiza la representación de características globales. (2) Se introduce un módulo de fusión de atención (ECA_GCA) para mejorar la representación de características de la red de backbone 2D al combinar información contextual de canal y global. Los resultados experimentales demuestran que NRAP-RCNN logra un AP de 88.4% para coches (R40) en el conjunto de validación de KITTI y 85.1% en el conjunto de prueba, superando significativamente a los métodos avanzados de detección 3D, mostrando su efectividad en la mejora del rendimiento de detección.

Otros recursos que podrían interesarte

Temas Virtualpro