logo móvil
Contáctanos

Detección de objetos orientados arbitrariamente en imágenes aéreas con convolución deformable dinámica y atención de canal auto-normalizante

Autores: Zhang, Yutong; Ma, Chunjie; Zhuo, Li; Li, Jiafeng

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Detección de objetos orientados arbitrariamente en imágenes aéreas con convolución deformable dinámica y atención de canal auto-normalizante


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Objetos
Imágenes aéreas
Detección
Método
Red de convolución

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 38

Citaciones: Sin citaciones


Descripción
Los objetos en imágenes aéreas a menudo tienen orientaciones arbitrarias y formas y tamaños variables. Como resultado, la detección precisa y robusta de objetos en imágenes aéreas es un problema desafiante. En este documento, se propone un método de detección de objetos orientados arbitrariamente para imágenes aéreas, basado en Convolución Deformable Dinámica (DDC) y Mecanismo de Atención de Canales Auto-normalizadores (SCAM); este método utiliza ReResNet-50 como red principal para extraer características equivariantes a la rotación. Primero, se propone DDC como reemplazo de la operación de convolución convencional en la Red Neuronal Convolucional (CNN) para hacer frente a diversas formas, tamaños y orientaciones arbitrarias de los objetos. En segundo lugar, SCAM se incrusta en la capa superior de ReResNet-50, lo que permite a la red mejorar los canales de características importantes y suprimir los irrelevantes. Finalmente, se generan Regiones de Interés de Rotación (RRoI) basadas en una Red de Propuesta de Regiones (RPN) y un Transformador de Regiones de Interés (RT), y la clasificación y regresión de cajas delimitadoras por Región de Interés Invariante a la Rotación (RiRoI Align). El método propuesto se evalúa exhaustivamente en tres conjuntos de datos de referencia públicos disponibles. La Precisión Promedio Media (mAP) puede alcanzar el 80.91%, 92.73% y 94.1% en los conjuntos de datos DOTA-v1.0, DOTA-v1.5 y HRSC2016, respectivamente. Los resultados experimentales muestran que, en comparación con los métodos del estado del arte, el método propuesto puede lograr una precisión de detección superior.

Otros recursos que podrían interesarte

Temas Virtualpro