Una Red de Transformador Piramidal Eficiente para la Geo-localización Cruzada en Terrenos Complejos
Autores: Ju, Chengjie; Xu, Wangping; Chen, Nanxing; Zheng, Enhui
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Una Red de Transformador Piramidal Eficiente para la Geo-localización Cruzada en Terrenos Complejos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Vehículo aéreo no tripulado
Auto-localización
Conjunto de datos
Multi-uav
Extracción de características
Terrenos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La auto-localización de vehículos aéreos no tripulados (VANT) en entornos complejos es crítica cuando los sistemas de navegación por satélite global (GNSS) son poco fiables. Los conjuntos de datos existentes, a menudo limitados a escenas urbanas de baja altitud, obstaculizan la generalización. Este estudio presenta Multi-UAV, un nuevo conjunto de datos con 17.4 k pares de imágenes de alta resolución de VANT-satélite de diversos terrenos (urbano, rural, montañoso, agrícola, costero) y altitudes en toda China, mejorando la investigación en geolocalización de vista cruzada. Proponemos un transformador de pirámide de reducción de valor ligero (VRPT) para una extracción de características eficiente y una red de pirámide de características residuales (RFPN) para la fusión de características a múltiples escalas. Utilizando precisión a nivel de metro (MA@K) y puntaje de distancia relativa (RDS), VRPT logra una localización robusta y de alta precisión en terrenos variados, ofreciendo un potencial significativo para el despliegue de VANT con recursos limitados.
Descripción
La auto-localización de vehículos aéreos no tripulados (VANT) en entornos complejos es crítica cuando los sistemas de navegación por satélite global (GNSS) son poco fiables. Los conjuntos de datos existentes, a menudo limitados a escenas urbanas de baja altitud, obstaculizan la generalización. Este estudio presenta Multi-UAV, un nuevo conjunto de datos con 17.4 k pares de imágenes de alta resolución de VANT-satélite de diversos terrenos (urbano, rural, montañoso, agrícola, costero) y altitudes en toda China, mejorando la investigación en geolocalización de vista cruzada. Proponemos un transformador de pirámide de reducción de valor ligero (VRPT) para una extracción de características eficiente y una red de pirámide de características residuales (RFPN) para la fusión de características a múltiples escalas. Utilizando precisión a nivel de metro (MA@K) y puntaje de distancia relativa (RDS), VRPT logra una localización robusta y de alta precisión en terrenos variados, ofreciendo un potencial significativo para el despliegue de VANT con recursos limitados.