Una base de datos especializada para vehículos autónomos basada en el KITTI Vision Benchmark
Autores: Ortega-Gomez, Juan I.; Morales-Hernandez, Luis A.; Cruz-Albarran, Irving A.
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Una base de datos especializada para vehículos autónomos basada en el KITTI Vision Benchmark
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Sistemas de conducción autónoma
Percepción
Base de datos
Vista superior
Mapa de segmentación
Red neuronal
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 56
Citaciones: Sin citaciones
Los sistemas de conducción autónoma han surgido con la promesa de prevenir accidentes. El primer aspecto crítico de estos sistemas es la percepción, donde la práctica habitual es el uso de nubes de puntos en vista superior como entrada; sin embargo, las bases de datos existentes en esta área solo presentan escenas con nubes de puntos 3D y sus respectivas etiquetas. Esto genera una oportunidad, y el objetivo de este trabajo es presentar una base de datos con escenas directamente en vista superior y sus etiquetas en el plano respectivo, además de agregar un mapa de segmentación para cada escena como etiqueta para el trabajo de segmentación. Se presenta el método utilizado durante la creación de la base de datos propuesta; esto abarca cómo transformar nubes de puntos 3D a imágenes en vista superior 2D, cómo se generan las etiquetas de detección en el plano y cómo implementar una red neuronal para los mapas de segmentación generados de cada escena. Utilizando este método, se desarrolló una base de datos con 7481 escenas, cada una con su respectiva imagen en vista superior, archivo de etiquetas y mapa de segmentación, donde las métricas de segmentación de la carretera son las siguientes: F1, 95.77; AP, 92.54; ACC, 97.53; PRE, 94.34; y REC, 97.25. Este artículo presenta el desarrollo de una base de datos para asignaciones de segmentación y detección, destacando su uso particular para trabajos de percepción ambiental.
Descripción
Los sistemas de conducción autónoma han surgido con la promesa de prevenir accidentes. El primer aspecto crítico de estos sistemas es la percepción, donde la práctica habitual es el uso de nubes de puntos en vista superior como entrada; sin embargo, las bases de datos existentes en esta área solo presentan escenas con nubes de puntos 3D y sus respectivas etiquetas. Esto genera una oportunidad, y el objetivo de este trabajo es presentar una base de datos con escenas directamente en vista superior y sus etiquetas en el plano respectivo, además de agregar un mapa de segmentación para cada escena como etiqueta para el trabajo de segmentación. Se presenta el método utilizado durante la creación de la base de datos propuesta; esto abarca cómo transformar nubes de puntos 3D a imágenes en vista superior 2D, cómo se generan las etiquetas de detección en el plano y cómo implementar una red neuronal para los mapas de segmentación generados de cada escena. Utilizando este método, se desarrolló una base de datos con 7481 escenas, cada una con su respectiva imagen en vista superior, archivo de etiquetas y mapa de segmentación, donde las métricas de segmentación de la carretera son las siguientes: F1, 95.77; AP, 92.54; ACC, 97.53; PRE, 94.34; y REC, 97.25. Este artículo presenta el desarrollo de una base de datos para asignaciones de segmentación y detección, destacando su uso particular para trabajos de percepción ambiental.