GA-Net: Detección de objetos precisa y eficiente en imágenes de UAV basada en activaciones de cuadrícula
Autores: Zhang, Ruiyi; Luo, Bin; Su, Xin; Liu, Jun
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
GA-Net: Detección de objetos precisa y eficiente en imágenes de UAV basada en activaciones de cuadrícula
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Detección de objetos
Vehículo aéreo no tripulado
GA-Net
Módulo de Activación de Rejilla
GhostFPN
Red de Pirámide de Características
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La detección de objetos juega un papel crucial en las misiones de vehículos aéreos no tripulados (UAV), donde los objetos capturados son a menudo pequeños y requieren un procesamiento de alta resolución. Sin embargo, este requisito siempre está en conflicto con los recursos informáticos limitados, los vastos campos de visión y los requisitos de baja latencia. Para abordar estos problemas, proponemos GA-Net, un enfoque novedoso diseñado para imágenes de UAV. La innovación clave incluye el Módulo de Activación de Cuadrícula (GAM), que calcula de manera eficiente las activaciones de cuadrícula, la probabilidad de presencia de primer plano a escala de cuadrícula. Con las activaciones de cuadrícula, el GAM ayuda a filtrar parches sin objetos, minimizar cálculos redundantes y mejorar las velocidades de inferencia. Además, la Selección Dinámica de Muestras Basada en Cuadrícula (GDSS) enfoca el modelo en discriminar muestras positivas y negativos difíciles, abordando el sesgo de fondo durante el entrenamiento. Otras mejoras incluyen GhostFPN, que refina la Red de Pirámide de Características (FPN) utilizando el módulo Ghost y la convolución separable por profundidad. Esto no solo expande el campo receptivo para mejorar la precisión, sino que también reduce la complejidad computacional. Realizamos evaluaciones exhaustivas en DGTA-Cattle-v2, un conjunto de datos sintético con imágenes de fondo añadidas, y tres conjuntos de datos públicos (VisDrone, SeaDronesSee, DOTA) de diversos dominios. Los resultados demuestran la efectividad y aplicabilidad práctica de GA-Net. A pesar del desafío común de la compensación entre precisión y velocidad, nuestro GA-Net logra con éxito un escenario mutuamente beneficioso a través del uso estratégico de activaciones de cuadrícula.
Descripción
La detección de objetos juega un papel crucial en las misiones de vehículos aéreos no tripulados (UAV), donde los objetos capturados son a menudo pequeños y requieren un procesamiento de alta resolución. Sin embargo, este requisito siempre está en conflicto con los recursos informáticos limitados, los vastos campos de visión y los requisitos de baja latencia. Para abordar estos problemas, proponemos GA-Net, un enfoque novedoso diseñado para imágenes de UAV. La innovación clave incluye el Módulo de Activación de Cuadrícula (GAM), que calcula de manera eficiente las activaciones de cuadrícula, la probabilidad de presencia de primer plano a escala de cuadrícula. Con las activaciones de cuadrícula, el GAM ayuda a filtrar parches sin objetos, minimizar cálculos redundantes y mejorar las velocidades de inferencia. Además, la Selección Dinámica de Muestras Basada en Cuadrícula (GDSS) enfoca el modelo en discriminar muestras positivas y negativos difíciles, abordando el sesgo de fondo durante el entrenamiento. Otras mejoras incluyen GhostFPN, que refina la Red de Pirámide de Características (FPN) utilizando el módulo Ghost y la convolución separable por profundidad. Esto no solo expande el campo receptivo para mejorar la precisión, sino que también reduce la complejidad computacional. Realizamos evaluaciones exhaustivas en DGTA-Cattle-v2, un conjunto de datos sintético con imágenes de fondo añadidas, y tres conjuntos de datos públicos (VisDrone, SeaDronesSee, DOTA) de diversos dominios. Los resultados demuestran la efectividad y aplicabilidad práctica de GA-Net. A pesar del desafío común de la compensación entre precisión y velocidad, nuestro GA-Net logra con éxito un escenario mutuamente beneficioso a través del uso estratégico de activaciones de cuadrícula.