logo móvil
Contáctanos

Redes Paralelas de Múltiples Ramas para la Detección de Objetos en Imágenes de Teledetección de UAV de Alta Resolución

Autores: Wu, Qihong; Zhang, Bin; Guo, Chang; Wang, Lei

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Redes Paralelas de Múltiples Ramas para la Detección de Objetos en Imágenes de Teledetección de UAV de Alta Resolución


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Vehículos aéreos no tripulados
Detección de objetos
Teledetección
Modelo ViTDet
Red Paralela de Múltiples Ramas
Red de pirámide de características

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Los Vehículos Aéreos No Tripulados (VANT) son fundamentales para avanzar en el campo de la teledetección. Sin embargo, la complejidad del fondo y la densa distribución de objetos presentan considerables desafíos para la detección de objetos en imágenes de teledetección de VANT. Este artículo propone una Red Paralela de Múltiples Ramas (MBPN) basada en el modelo ViTDet (Transformador Visual para la Detección de Objetos), que tiene como objetivo mejorar la precisión de la detección de objetos en imágenes de teledetección de VANT. Inicialmente, se mejora la capacidad discriminativa del mapa de características de la Red de Pirámide de Características (FPN) al incorporar los módulos de Mejora del Campo Receptivo (RFE) y Atención Convolucional por Sí misma (CSA). Posteriormente, para mitigar la pérdida de información semántica, el proceso de muestreo de la FPN se reemplaza por los módulos de Aumento de Múltiples Ramas (MBUS) y Reducción de Múltiples Ramas (MBDS). Por último, se emplea un módulo de Fusión por Concatenación de Características (FCF) para fusionar mapas de características de diferentes niveles, abordando así el problema de desalineación semántica. Este artículo evalúa el rendimiento del modelo propuesto tanto en un conjunto de datos WCH capturado por VANT como en el conjunto de datos NWPU VHR10 disponible públicamente. Los resultados experimentales demuestran que el modelo propuesto logra un aumento en el APL del 2.4% y 0.7% en los conjuntos de datos WCH y NWPU VHR10, respectivamente, en comparación con el modelo base ViTDet-B.

Otros recursos que podrían interesarte

Temas Virtualpro