logo móvil
Contáctanos

O2SAT: Red de Atención Espacial Guiada por Segmentación Orientada a Objetos para la Detección de Objetos 3D en Vehículos Autónomos

Autores: Mushtaq, Husnain; Deng, Xiaoheng; Ullah, Irshad; Ali, Mubashir; Malik, Babur Hayat

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

O2SAT: Red de Atención Espacial Guiada por Segmentación Orientada a Objetos para la Detección de Objetos 3D en Vehículos Autónomos


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Vehículos autónomos
Detección de objetos en 3D
Lidar
Entornos urbanos sostenibles
Mecanismo de atención espacial
Condiciones de la carretera

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Los vehículos autónomos (AVs) buscan adaptarse a las características específicas de los entornos urbanos sostenibles. La detección precisa de objetos en 3D con LiDAR es fundamental para la conducción autónoma. Sin embargo, la investigación existente se basa predominantemente en la suposición basada en objetos en 3D, lo que pasa por alto la complejidad de los entornos viales del mundo real. En consecuencia, los métodos actuales experimentan una degradación del rendimiento al centrarse solo en características locales y pasar por alto la intersección de objetos y características de la carretera, especialmente en condiciones de carretera irregulares. Este estudio propone un enfoque de Segmentación Espacial Orientada a Objetos en 3D (O2SAT) para distinguir puntos de objetos de puntos de carretera y mejorar el aprendizaje de características clave mediante un mecanismo de atención espacial por canal. O2SAT consta de tres módulos: Segmentación Orientada a Objetos (OOS), Reajuste de Características de Atención Espacial (SFR) y Cabeza de Detección 3D Consciente de la Carretera (R3D). OOS distingue puntos de objetos y de carretera y realiza un muestreo descendente consciente de objetos para aumentar los datos al aprender a identificar la conexión oculta entre el paisaje y el objeto; SFR realiza una augmentación de pesos para aprender relaciones vecinas cruciales y ajustar dinámicamente los pesos de las características a través de mecanismos de atención espacial, lo que mejora las interacciones a larga distancia y la discriminación de características contextuales para la supresión de ruido, mejorando el rendimiento general de detección; y R3D utiliza segmentación de objetos refinada y representaciones de características optimizadas. Nuestro sistema pronostica la confianza de la predicción en las estructuras de puntos existentes. La efectividad y robustez de nuestro método a través de diversos conjuntos de datos (KITTI) ha sido demostrada a través de amplios experimentos. Los módulos propuestos se integran sin problemas en marcos basados en puntos existentes, siguiendo un enfoque de plug-and-play.

Otros recursos que podrían interesarte

Temas Virtualpro