logo móvil
Contáctanos

Reconstrucción de mapa semántico BEV para autos autónomos con el mecanismo de atención de múltiples cabezas

Autores: Liao, Yi-Cheng; Tsai, Jichiang; Chien, Hsuan-Ying

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Reconstrucción de mapa semántico BEV para autos autónomos con el mecanismo de atención de múltiples cabezas


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Percepción ambiental
Conducción autónoma
Lidar 3D
Marcos de visión cruzada basados en cámaras
Mapa de vista cenital
Mecanismo de atención multi-cabeza

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 35

Citaciones: Sin citaciones


Descripción
La percepción ambiental es crucial para la conducción autónoma segura, permitiendo un análisis preciso del entorno del vehículo. Si bien el LiDAR 3D se utiliza tradicionalmente para la reconstrucción del entorno en 3D, su alto costo y complejidad presentan desafíos. En contraste, los marcos cruzados basados en cámaras pueden ofrecer una alternativa rentable. Por lo tanto, este manuscrito propone un nuevo modelo cruzado para extraer características de mapeo de imágenes de cámara y luego transferirlas a un mapa de Vista de Pájaro (BEV). En particular, un mecanismo de atención de múltiples cabezas en la arquitectura del decodificador genera el mapa semántico final. Cada cámara aprende información de incrustación correspondiente a su posición y ángulo dentro del mapa BEV. La atención cruzada fusiona información de diferentes perspectivas para predecir características del mapa de arriba hacia abajo enriquecidas con información espacial. El mecanismo de atención de múltiples cabezas realiza coincidencias de dependencia a nivel global, mejorando la información de largo alcance y capturando relaciones latentes entre características. La convolución transpuesta reemplaza los métodos tradicionales de aumento de tamaño, evitando similitudes altas de características locales y facilitando la inferencia de segmentación semántica del mapa BEV. Finalmente, realizamos numerosos experimentos de simulación para verificar el rendimiento de nuestro modelo cruzado.

Otros recursos que podrían interesarte

Temas Virtualpro