Método de detección de objetos en 3D Global PointPillars basado en Transformer
Autores: Zhang, Lin; Meng, Hua; Yan, Yunbing; Xu, Xiaowei
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Método de detección de objetos en 3D Global PointPillars basado en Transformer
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Algoritmo
Nube de puntos
Extracción de características
Contexto global
Estructura local
Detección de objetos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 45
Citaciones: Sin citaciones
El algoritmo PointPillars puede detectar vehículos, peatones y ciclistas en la carretera, y es ampliamente utilizado en el campo de la conciencia ambiental en la conducción autónoma. Sin embargo, su red de codificación de características solo utiliza una red PointNet minimalista para la extracción de características de la información de la nube de puntos, lo que no considera la información de contexto global de la nube de puntos, y las características de estructura local no se extraen suficientemente, y estas pérdidas de características pueden afectar seriamente el rendimiento de la red de detección de objetos. Para abordar este problema, este documento propone un algoritmo PointPillars mejorado llamado TGPP: PointPillars Globales basados en Transformadores. Después de que la nube de puntos se divide en varios pilares, las características de contexto global y las características de estructura local se extraen mediante un mecanismo de atención de múltiples cabezas, de modo que la nube de puntos después de la codificación de características tenga características de contexto global y características de estructura local; la pseudoimagen bidimensional generada por esta característica se utiliza para el aprendizaje de características mediante una red neuronal convolucional bidimensional. Finalmente, se utiliza la cabeza de detección SSD para lograr la detección de objetos 3D. Se demuestra que el TGPP logra una mejora promedio de precisión del 2.64% en el conjunto de pruebas de KITTI.
Descripción
El algoritmo PointPillars puede detectar vehículos, peatones y ciclistas en la carretera, y es ampliamente utilizado en el campo de la conciencia ambiental en la conducción autónoma. Sin embargo, su red de codificación de características solo utiliza una red PointNet minimalista para la extracción de características de la información de la nube de puntos, lo que no considera la información de contexto global de la nube de puntos, y las características de estructura local no se extraen suficientemente, y estas pérdidas de características pueden afectar seriamente el rendimiento de la red de detección de objetos. Para abordar este problema, este documento propone un algoritmo PointPillars mejorado llamado TGPP: PointPillars Globales basados en Transformadores. Después de que la nube de puntos se divide en varios pilares, las características de contexto global y las características de estructura local se extraen mediante un mecanismo de atención de múltiples cabezas, de modo que la nube de puntos después de la codificación de características tenga características de contexto global y características de estructura local; la pseudoimagen bidimensional generada por esta característica se utiliza para el aprendizaje de características mediante una red neuronal convolucional bidimensional. Finalmente, se utiliza la cabeza de detección SSD para lograr la detección de objetos 3D. Se demuestra que el TGPP logra una mejora promedio de precisión del 2.64% en el conjunto de pruebas de KITTI.