logo móvil
Contáctanos

Marco de Localización y Mapeo Simultáneo Semántico Visual Centrado en Vehículos Aéreos No Tripulados y Vehículos Terrestres No Tripulados con Interacción Remota para Escenarios Dinámicos

Autores: Liu, Chang; Zhang, Yang; Ma, Liqun; Huang, Yong; Liu, Keyan; Wang, Guangwei

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

Marco de Localización y Mapeo Simultáneo Semántico Visual Centrado en Vehículos Aéreos No Tripulados y Vehículos Terrestres No Tripulados con Interacción Remota para Escenarios Dinámicos


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Introducción
Vehículo aéreo no tripulado
Localización y mapeo semántico visual simultáneo
Cámaras RGB-D
Detección de objetos basada en YOLO
Arquitectura de comunicación de doble canal

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
En este estudio, presentamos un marco de localización y mapeo simultáneo (SLAM) centrado en vehículos aéreos no tripulados (UAV) que integra cámaras RGB-D, unidades de medida inerciales (IMU) y un módulo de interacción remota habilitado para 5G. Nuestro sistema aborda tres limitaciones críticas en los enfoques existentes: (1) restricciones de distancia en operaciones remotas; (2) suposiciones de mapas estáticos en entornos dinámicos; y (3) requisitos de percepción de alta dimensión para aplicaciones basadas en UAV. Al combinar la detección de objetos basada en YOLO con la eliminación de características dinámicas basada en restricciones epipolares, nuestro método logra un mapeo semántico en tiempo real mientras rechaza artefactos de movimiento. El marco también incorpora una arquitectura de comunicación de doble canal para permitir un control fluido de humanos en el bucle sobre equipos de UAV y vehículos terrestres no tripulados (UGV) en escenarios a gran escala. La validación experimental en entornos interiores y exteriores indica que el sistema puede alcanzar una tasa de detección de hasta 75 fotogramas por segundo (FPS) en un NVIDIA Jetson AGX Xavier utilizando YOLO-FASTEST, asegurando la identificación rápida de objetos dinámicos. En escenarios dinámicos, la precisión de localización alcanza un error de posición absoluto promedio (APE) de 0.1275 m. Esto supera a los métodos de vanguardia como Dynamic-VINS (0.211 m) y ORB-SLAM3 (0.148 m) en el conjunto de datos EuRoC MAV. La arquitectura de comunicación de doble canal (Web Real-Time Communication (WebRTC) para video y Message Queuing Telemetry Transport (MQTT) para telemetría) reduce el consumo de ancho de banda en un 65% en comparación con los protocolos tradicionales basados en TCP. Además, nuestro filtrado de características dinámicas híbrido puede rechazar el 89% de las características dinámicas en escenarios ocluidos, garantizando un mapeo preciso en entornos complejos. Nuestro marco representa un avance significativo en la habilitación de UAVs/UGVs inteligentes para navegar e interactuar en entornos complejos y dinámicos, ofreciendo comprensión semántica en tiempo real y localización precisa.

Otros recursos que podrían interesarte

Temas Virtualpro