NRAP-RCNN: Un método de detección de objetos 3D basado en nubes de puntos pseudo, reducción de ruido, convolución dispersa y mecanismo de atención

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

NRAP-RCNN: Un método de detección de objetos 3D basado en nubes de puntos pseudo, reducción de ruido, convolución dispersa y mecanismo de atención

Autores: Zhou, Ziyue; Jia, Yongqing; Zhu, Tao; Wan, Yaping

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico

2025

NRAP-RCNN: Un método de detección de objetos 3D basado en nubes de puntos pseudo, reducción de ruido, convolución dispersa y mecanismo de atención

Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Nubes de puntos pseudo

Detección de objetos en 3D

NRAP-RCNN

Reducción de ruido

Red de convolución dispersa

Información contextual global

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

En los últimos años, las nubes de puntos pseudo generadas a partir de la finalización de profundidad de imágenes RGB y datos LiDAR han proporcionado una base sólida para la detección de objetos 3D multimodal. Sin embargo, el proceso de generación a menudo introduce ruido, reduciendo la calidad de los datos y la precisión de la detección. Además, los métodos existentes no logran capturar de manera efectiva las correlaciones de canal y la información contextual global durante la etapa de extracción de características 2D después de la red de backbone 3D, limitando el rendimiento de detección. Para abordar estos desafíos, este documento propone NRAP-RCNN, un método de detección de objetos 3D basado en nubes de puntos pseudo con dos innovaciones clave: (1) Una red de convolución dispersa de reducción de ruido (NRConvNet), que comprende NRConv (convolución dispersa submanifold resistente al ruido), SRB (bloque residual de convolución dispersa) y MHSA (atención propia de múltiples cabezas). NRConv suprime el ruido de la nube de puntos pseudo al codificar conjuntamente características 2D y 3D, SRB mejora la profundidad y robustez de la extracción de características, y MHSA optimiza la representación de características globales. (2) Se introduce un módulo de fusión de atención (ECA_GCA) para mejorar la representación de características de la red de backbone 2D al combinar información contextual de canal y global. Los resultados experimentales demuestran que NRAP-RCNN logra un AP de 88.4% para coches (R40) en el conjunto de validación de KITTI y 85.1% en el conjunto de prueba, superando significativamente a los métodos avanzados de detección 3D, mostrando su efectividad en la mejora del rendimiento de detección.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro