Detección y Segmentación de Múltiples Objetos Basada en CNN en Datos LiDAR 3D para Entornos Industriales Dinámicos
Autores: Schneider, Danilo Giacomin; Stemmer, Marcelo Ricardo
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Detección y Segmentación de Múltiples Objetos Basada en CNN en Datos LiDAR 3D para Entornos Industriales Dinámicos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Navegación autónoma
Redes neuronales convolucionales
Espacio 3d
Datos lidar
Robots móviles
Conjuntos de datos del mundo real
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
La navegación autónoma en entornos dinámicos presenta un desafío significativo para los sistemas robóticos móviles. Este documento propone un enfoque novedoso que utiliza Redes Neuronales Convolucionales (CNN) para la detección de múltiples objetos en espacio 3D y segmentación 2D utilizando mapas en vista de pájaro (BEV) derivados de datos de Detección y Rango por Luz (LiDAR) en 3D. Nuestro método tiene como objetivo permitir que los robots móviles localicen objetos móviles y su ocupación, lo cual es crucial para una navegación segura y eficiente. Para abordar la escasez de conjuntos de datos etiquetados del mundo real, se genera un conjunto de datos sintético basado en un entorno de simulación para entrenar y evaluar nuestro modelo. Además, empleamos un subconjunto del conjunto de datos NVIDIA r2b para la evaluación en el mundo real. Además, integramos nuestro modelo de detección y segmentación basado en CNN en un marco del Sistema Operativo de Robots 2 (ROS2), facilitando la comunicación entre robots móviles y un nodo centralizado para la agregación de datos y creación de mapas. Nuestros resultados experimentales demuestran un rendimiento prometedor, mostrando la aplicabilidad potencial de nuestro enfoque en futuros sistemas de ensamblaje. Si bien se justifica una validación adicional con datos del mundo real, nuestro trabajo contribuye al avance de los sistemas de percepción al proponer una solución para el seguimiento y mapeo de múltiples fuentes y múltiples objetos.
Descripción
La navegación autónoma en entornos dinámicos presenta un desafío significativo para los sistemas robóticos móviles. Este documento propone un enfoque novedoso que utiliza Redes Neuronales Convolucionales (CNN) para la detección de múltiples objetos en espacio 3D y segmentación 2D utilizando mapas en vista de pájaro (BEV) derivados de datos de Detección y Rango por Luz (LiDAR) en 3D. Nuestro método tiene como objetivo permitir que los robots móviles localicen objetos móviles y su ocupación, lo cual es crucial para una navegación segura y eficiente. Para abordar la escasez de conjuntos de datos etiquetados del mundo real, se genera un conjunto de datos sintético basado en un entorno de simulación para entrenar y evaluar nuestro modelo. Además, empleamos un subconjunto del conjunto de datos NVIDIA r2b para la evaluación en el mundo real. Además, integramos nuestro modelo de detección y segmentación basado en CNN en un marco del Sistema Operativo de Robots 2 (ROS2), facilitando la comunicación entre robots móviles y un nodo centralizado para la agregación de datos y creación de mapas. Nuestros resultados experimentales demuestran un rendimiento prometedor, mostrando la aplicabilidad potencial de nuestro enfoque en futuros sistemas de ensamblaje. Si bien se justifica una validación adicional con datos del mundo real, nuestro trabajo contribuye al avance de los sistemas de percepción al proponer una solución para el seguimiento y mapeo de múltiples fuentes y múltiples objetos.