La segmentación semántica de nubes de puntos LiDAR en la conducción autónoma se basa en convolución asimétrica
Autores: Sun, Xiang; Song, Shaojing; Miao, Zhiqing; Tang, Pan; Ai, Luxia
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
La segmentación semántica de nubes de puntos LiDAR en la conducción autónoma se basa en convolución asimétrica
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Lidar
Conducción autónoma
Acpnet
Segmentación semántica
Convolución
Extracción de características
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 40
Citaciones: Sin citaciones
LiDAR se ha convertido en un sensor vital para la comprensión de escenas de conducción autónoma. Para cumplir con la precisión y velocidad de la segmentación semántica de nubes de puntos LiDAR, en este artículo se propone un modelo eficiente ACPNet. En la etapa de extracción de características, el esqueleto del núcleo de convolución cuadrado se refuerza mediante convoluciones asimétricas, lo que conduce a una mayor robustez a la rotación del objetivo. Además, se diseña un módulo de mejora de características contextuales para extraer características contextuales más ricas. Durante el entrenamiento, se realizan escalado global y traslación global para enriquecer la diversidad de conjuntos de datos. En comparación con la red base PolarNet, el mIoU de ACPNet en los conjuntos de datos SemanticKITTI, SemanticPOSS y nuScenes se mejora en un 5,1%, 1,6% y 2,9%, respectivamente. Mientras tanto, la velocidad de ACPNet es de 14 FPS, lo que básicamente cumple con los requisitos de tiempo real en escenarios de conducción autónoma. Los resultados experimentales muestran que ACPNet mejora significativamente el rendimiento de la segmentación semántica de nubes de puntos LiDAR.
Descripción
LiDAR se ha convertido en un sensor vital para la comprensión de escenas de conducción autónoma. Para cumplir con la precisión y velocidad de la segmentación semántica de nubes de puntos LiDAR, en este artículo se propone un modelo eficiente ACPNet. En la etapa de extracción de características, el esqueleto del núcleo de convolución cuadrado se refuerza mediante convoluciones asimétricas, lo que conduce a una mayor robustez a la rotación del objetivo. Además, se diseña un módulo de mejora de características contextuales para extraer características contextuales más ricas. Durante el entrenamiento, se realizan escalado global y traslación global para enriquecer la diversidad de conjuntos de datos. En comparación con la red base PolarNet, el mIoU de ACPNet en los conjuntos de datos SemanticKITTI, SemanticPOSS y nuScenes se mejora en un 5,1%, 1,6% y 2,9%, respectivamente. Mientras tanto, la velocidad de ACPNet es de 14 FPS, lo que básicamente cumple con los requisitos de tiempo real en escenarios de conducción autónoma. Los resultados experimentales muestran que ACPNet mejora significativamente el rendimiento de la segmentación semántica de nubes de puntos LiDAR.