Impulsando la Detección de Objetos en Nubes de Puntos LiDAR a través de la Fusión de Características Globales
Autores: Zhang, Xu; Tian, Fengchang; Sun, Jiaxing; Liu, Yan
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Impulsando la Detección de Objetos en Nubes de Puntos LiDAR a través de la Fusión de Características Globales
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Propuestas
Lidar
Nube de puntos
Características globales
Campo receptivo
Bloque de mapeo de vóxeles
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Para abordar la limitación de los campos receptivos causada por el uso de convoluciones locales en los métodos actuales de detección de objetos en nubes de puntos, este artículo propone un algoritmo de detección de objetos en nubes de puntos LiDAR que integra características globales. El método propuesto emplea un Bloque de Mapeo de Vóxel (VMB) y un Bloque de Extracción de Características Globales (GFEB) para convertir los datos de la nube de puntos en una secuencia larga unidimensional. Luego utiliza convoluciones no locales para modelar toda la nube de puntos voxelizada e incorporar información contextual global, mejorando así el campo receptivo de la red y su capacidad para extraer y aprender características globales. Además, se diseña un módulo de Extracción de Características de Canal de Vóxel (VCFE) para capturar información espacial local asociando características a través de diferentes canales, mitigando efectivamente la pérdida de información espacial introducida durante la transformación unidimensional. Los resultados experimentales demuestran que, en comparación con los métodos más avanzados, el enfoque propuesto mejora la precisión promedio de los objetivos de vehículos, peatones y ciclistas en el subconjunto de Waymo en un 0.64%, 0.71% y 0.66%, respectivamente. En el conjunto de datos nuScenes, la precisión de detección para objetivos variados aumentó en un 0.7%, con NDS y mAP mejorando en un 0.3% y un 0.5%, respectivamente. En particular, el método exhibe un rendimiento excepcional en la detección de objetos pequeños, mejorando significativamente la precisión general de la detección de objetos en nubes de puntos.
Descripción
Para abordar la limitación de los campos receptivos causada por el uso de convoluciones locales en los métodos actuales de detección de objetos en nubes de puntos, este artículo propone un algoritmo de detección de objetos en nubes de puntos LiDAR que integra características globales. El método propuesto emplea un Bloque de Mapeo de Vóxel (VMB) y un Bloque de Extracción de Características Globales (GFEB) para convertir los datos de la nube de puntos en una secuencia larga unidimensional. Luego utiliza convoluciones no locales para modelar toda la nube de puntos voxelizada e incorporar información contextual global, mejorando así el campo receptivo de la red y su capacidad para extraer y aprender características globales. Además, se diseña un módulo de Extracción de Características de Canal de Vóxel (VCFE) para capturar información espacial local asociando características a través de diferentes canales, mitigando efectivamente la pérdida de información espacial introducida durante la transformación unidimensional. Los resultados experimentales demuestran que, en comparación con los métodos más avanzados, el enfoque propuesto mejora la precisión promedio de los objetivos de vehículos, peatones y ciclistas en el subconjunto de Waymo en un 0.64%, 0.71% y 0.66%, respectivamente. En el conjunto de datos nuScenes, la precisión de detección para objetivos variados aumentó en un 0.7%, con NDS y mAP mejorando en un 0.3% y un 0.5%, respectivamente. En particular, el método exhibe un rendimiento excepcional en la detección de objetos pequeños, mejorando significativamente la precisión general de la detección de objetos en nubes de puntos.