O2SAT: Red de Atención Espacial Guiada por Segmentación Orientada a Objetos para la Detección de Objetos 3D en Vehículos Autónomos
Autores: Mushtaq, Husnain; Deng, Xiaoheng; Ullah, Irshad; Ali, Mubashir; Malik, Babur Hayat
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
O2SAT: Red de Atención Espacial Guiada por Segmentación Orientada a Objetos para la Detección de Objetos 3D en Vehículos Autónomos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Vehículos autónomos
Detección de objetos en 3D
Lidar
Entornos urbanos sostenibles
Mecanismo de atención espacial
Condiciones de la carretera
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los vehículos autónomos (AVs) buscan adaptarse a las características específicas de los entornos urbanos sostenibles. La detección precisa de objetos en 3D con LiDAR es fundamental para la conducción autónoma. Sin embargo, la investigación existente se basa predominantemente en la suposición basada en objetos en 3D, lo que pasa por alto la complejidad de los entornos viales del mundo real. En consecuencia, los métodos actuales experimentan una degradación del rendimiento al centrarse solo en características locales y pasar por alto la intersección de objetos y características de la carretera, especialmente en condiciones de carretera irregulares. Este estudio propone un enfoque de Segmentación Espacial Orientada a Objetos en 3D (O2SAT) para distinguir puntos de objetos de puntos de carretera y mejorar el aprendizaje de características clave mediante un mecanismo de atención espacial por canal. O2SAT consta de tres módulos: Segmentación Orientada a Objetos (OOS), Reajuste de Características de Atención Espacial (SFR) y Cabeza de Detección 3D Consciente de la Carretera (R3D). OOS distingue puntos de objetos y de carretera y realiza un muestreo descendente consciente de objetos para aumentar los datos al aprender a identificar la conexión oculta entre el paisaje y el objeto; SFR realiza una augmentación de pesos para aprender relaciones vecinas cruciales y ajustar dinámicamente los pesos de las características a través de mecanismos de atención espacial, lo que mejora las interacciones a larga distancia y la discriminación de características contextuales para la supresión de ruido, mejorando el rendimiento general de detección; y R3D utiliza segmentación de objetos refinada y representaciones de características optimizadas. Nuestro sistema pronostica la confianza de la predicción en las estructuras de puntos existentes. La efectividad y robustez de nuestro método a través de diversos conjuntos de datos (KITTI) ha sido demostrada a través de amplios experimentos. Los módulos propuestos se integran sin problemas en marcos basados en puntos existentes, siguiendo un enfoque de plug-and-play.
Descripción
Los vehículos autónomos (AVs) buscan adaptarse a las características específicas de los entornos urbanos sostenibles. La detección precisa de objetos en 3D con LiDAR es fundamental para la conducción autónoma. Sin embargo, la investigación existente se basa predominantemente en la suposición basada en objetos en 3D, lo que pasa por alto la complejidad de los entornos viales del mundo real. En consecuencia, los métodos actuales experimentan una degradación del rendimiento al centrarse solo en características locales y pasar por alto la intersección de objetos y características de la carretera, especialmente en condiciones de carretera irregulares. Este estudio propone un enfoque de Segmentación Espacial Orientada a Objetos en 3D (O2SAT) para distinguir puntos de objetos de puntos de carretera y mejorar el aprendizaje de características clave mediante un mecanismo de atención espacial por canal. O2SAT consta de tres módulos: Segmentación Orientada a Objetos (OOS), Reajuste de Características de Atención Espacial (SFR) y Cabeza de Detección 3D Consciente de la Carretera (R3D). OOS distingue puntos de objetos y de carretera y realiza un muestreo descendente consciente de objetos para aumentar los datos al aprender a identificar la conexión oculta entre el paisaje y el objeto; SFR realiza una augmentación de pesos para aprender relaciones vecinas cruciales y ajustar dinámicamente los pesos de las características a través de mecanismos de atención espacial, lo que mejora las interacciones a larga distancia y la discriminación de características contextuales para la supresión de ruido, mejorando el rendimiento general de detección; y R3D utiliza segmentación de objetos refinada y representaciones de características optimizadas. Nuestro sistema pronostica la confianza de la predicción en las estructuras de puntos existentes. La efectividad y robustez de nuestro método a través de diversos conjuntos de datos (KITTI) ha sido demostrada a través de amplios experimentos. Los módulos propuestos se integran sin problemas en marcos basados en puntos existentes, siguiendo un enfoque de plug-and-play.