Un generación de mapa visual basada en aprendizaje profundo para la navegación de robots móviles
Autores: García-Pintos, Carlos A.; Aldana-Murillo, Noé G.; Ovalle-Magallanes, Emmanuel; Martínez, Edgar
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un generación de mapa visual basada en aprendizaje profundo para la navegación de robots móviles
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería General
Palabras clave
Estrategia
Navegación de robots
Mapa visual
Localización
Planificación
Ambiente
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
La navegación de robots basada en mapas visuales es una estrategia que solo utiliza el sistema de visión del robot, involucrando cuatro etapas fundamentales: aprendizaje o mapeo, localización, planificación y navegación. Por lo tanto, es fundamental modelar el entorno de manera óptima para llevar a cabo las etapas mencionadas anteriormente. En este documento, proponemos un marco novedoso para generar un mapa visual para entornos tanto interiores como exteriores. El mapa visual consta de imágenes clave que comparten información visual entre imágenes clave consecutivas. Esta etapa de aprendizaje emplea un transformador de características locales pre-entrenado (LoFTR) restringido con una transformación proyectiva 3D (una matriz fundamental) entre dos imágenes clave consecutivas. Los valores atípicos se detectan eficientemente utilizando consenso de muestras de marginalización (MAGSAC) mientras se estima la matriz fundamental. Realizamos experimentos extensos para validar nuestro enfoque en seis conjuntos de datos diferentes y comparar su rendimiento con métodos hechos a mano.
Descripción
La navegación de robots basada en mapas visuales es una estrategia que solo utiliza el sistema de visión del robot, involucrando cuatro etapas fundamentales: aprendizaje o mapeo, localización, planificación y navegación. Por lo tanto, es fundamental modelar el entorno de manera óptima para llevar a cabo las etapas mencionadas anteriormente. En este documento, proponemos un marco novedoso para generar un mapa visual para entornos tanto interiores como exteriores. El mapa visual consta de imágenes clave que comparten información visual entre imágenes clave consecutivas. Esta etapa de aprendizaje emplea un transformador de características locales pre-entrenado (LoFTR) restringido con una transformación proyectiva 3D (una matriz fundamental) entre dos imágenes clave consecutivas. Los valores atípicos se detectan eficientemente utilizando consenso de muestras de marginalización (MAGSAC) mientras se estima la matriz fundamental. Realizamos experimentos extensos para validar nuestro enfoque en seis conjuntos de datos diferentes y comparar su rendimiento con métodos hechos a mano.