logo móvil
Contáctanos

MFEFNet: Una Red de Extracción y Fusión de Información de Características Multi-escala para la Detección de Objetos Multi-escala en Imágenes Aéreas de UAV

Autores: Zhou, Liming; Zhao, Shuai; Wan, Ziye; Liu, Yang; Wang, Yadi; Zuo, Xianyu

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

MFEFNet: Una Red de Extracción y Fusión de Información de Características Multi-escala para la Detección de Objetos Multi-escala en Imágenes Aéreas de UAV


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Vehículos aéreos no tripulados
Imágenes de UAV
Detección de objetos
Agregación de características globales
Extracción de características contextuales
MFEFNet

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Los vehículos aéreos no tripulados (VANT) se utilizan ahora ampliamente en muchos campos. Debido a la aleatoriedad de la altura de vuelo y el ángulo de disparo de los VANT, las imágenes de estos suelen tener las siguientes características: muchos objetos pequeños, grandes cambios en la escala de los objetos y un fondo complejo. Por lo tanto, la detección de objetos en imágenes aéreas de VANT es una tarea muy desafiante. Para abordar los desafíos que plantean estas características, este artículo propone un nuevo método de detección de objetos en imágenes de VANT basado en la agregación de características globales y la extracción de características contextuales, denominado red de extracción y fusión de información de características multiescala (MFEFNet). Específicamente, en primer lugar, para extraer la información de características de los objetos de manera más efectiva de fondos complejos, proponemos un módulo de extracción de información espacial eficiente (SIEM), que combina conexiones residuales para construir dependencias de características a larga distancia y extrae de manera efectiva la información de características más útil al construir relaciones de características contextuales alrededor de los objetos. En segundo lugar, para mejorar la eficiencia de fusión de características y reducir la carga que traen las redes de fusión de características redundantes, proponemos una red de fusión de características progresiva de agregación global (GAFN). Esta red adopta un método de fusión de características adaptativo de tres niveles, que puede fusionar adaptativamente características multiescala según la importancia de diferentes capas de características y reducir características intermedias redundantes innecesarias utilizando el módulo de fusión de características adaptativas (AFFM). Además, utilizamos la función de pérdida MPDIoU como función de pérdida de regresión de cajas delimitadoras, que no solo mejora la robustez del modelo al ruido, sino que también simplifica el proceso de cálculo y mejora la eficiencia de detección final. Finalmente, la MFEFNet propuesta fue probada en los conjuntos de datos VisDrone y UAVDT, y el valor mAP0.5 aumentó en un 2.7% y un 2.2%, respectivamente.

Otros recursos que podrían interesarte

Temas Virtualpro