logo móvil
Contáctanos

GA-Net: Detección de objetos precisa y eficiente en imágenes de UAV basada en activaciones de cuadrícula

Autores: Zhang, Ruiyi; Luo, Bin; Su, Xin; Liu, Jun

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

GA-Net: Detección de objetos precisa y eficiente en imágenes de UAV basada en activaciones de cuadrícula


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Detección de objetos
Vehículo aéreo no tripulado
GA-Net
Módulo de Activación de Rejilla
GhostFPN
Red de Pirámide de Características

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
La detección de objetos juega un papel crucial en las misiones de vehículos aéreos no tripulados (UAV), donde los objetos capturados son a menudo pequeños y requieren un procesamiento de alta resolución. Sin embargo, este requisito siempre está en conflicto con los recursos informáticos limitados, los vastos campos de visión y los requisitos de baja latencia. Para abordar estos problemas, proponemos GA-Net, un enfoque novedoso diseñado para imágenes de UAV. La innovación clave incluye el Módulo de Activación de Cuadrícula (GAM), que calcula de manera eficiente las activaciones de cuadrícula, la probabilidad de presencia de primer plano a escala de cuadrícula. Con las activaciones de cuadrícula, el GAM ayuda a filtrar parches sin objetos, minimizar cálculos redundantes y mejorar las velocidades de inferencia. Además, la Selección Dinámica de Muestras Basada en Cuadrícula (GDSS) enfoca el modelo en discriminar muestras positivas y negativos difíciles, abordando el sesgo de fondo durante el entrenamiento. Otras mejoras incluyen GhostFPN, que refina la Red de Pirámide de Características (FPN) utilizando el módulo Ghost y la convolución separable por profundidad. Esto no solo expande el campo receptivo para mejorar la precisión, sino que también reduce la complejidad computacional. Realizamos evaluaciones exhaustivas en DGTA-Cattle-v2, un conjunto de datos sintético con imágenes de fondo añadidas, y tres conjuntos de datos públicos (VisDrone, SeaDronesSee, DOTA) de diversos dominios. Los resultados demuestran la efectividad y aplicabilidad práctica de GA-Net. A pesar del desafío común de la compensación entre precisión y velocidad, nuestro GA-Net logra con éxito un escenario mutuamente beneficioso a través del uso estratégico de activaciones de cuadrícula.

Otros recursos que podrían interesarte

Temas Virtualpro