Detección de objetos orientados arbitrariamente en imágenes aéreas con convolución deformable dinámica y atención de canal auto-normalizante
Autores: Zhang, Yutong; Ma, Chunjie; Zhuo, Li; Li, Jiafeng
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Detección de objetos orientados arbitrariamente en imágenes aéreas con convolución deformable dinámica y atención de canal auto-normalizante
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Objetos
Imágenes aéreas
Detección
Método
Red de convolución
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 38
Citaciones: Sin citaciones
Los objetos en imágenes aéreas a menudo tienen orientaciones arbitrarias y formas y tamaños variables. Como resultado, la detección precisa y robusta de objetos en imágenes aéreas es un problema desafiante. En este documento, se propone un método de detección de objetos orientados arbitrariamente para imágenes aéreas, basado en Convolución Deformable Dinámica (DDC) y Mecanismo de Atención de Canales Auto-normalizadores (SCAM); este método utiliza ReResNet-50 como red principal para extraer características equivariantes a la rotación. Primero, se propone DDC como reemplazo de la operación de convolución convencional en la Red Neuronal Convolucional (CNN) para hacer frente a diversas formas, tamaños y orientaciones arbitrarias de los objetos. En segundo lugar, SCAM se incrusta en la capa superior de ReResNet-50, lo que permite a la red mejorar los canales de características importantes y suprimir los irrelevantes. Finalmente, se generan Regiones de Interés de Rotación (RRoI) basadas en una Red de Propuesta de Regiones (RPN) y un Transformador de Regiones de Interés (RT), y la clasificación y regresión de cajas delimitadoras por Región de Interés Invariante a la Rotación (RiRoI Align). El método propuesto se evalúa exhaustivamente en tres conjuntos de datos de referencia públicos disponibles. La Precisión Promedio Media (mAP) puede alcanzar el 80.91%, 92.73% y 94.1% en los conjuntos de datos DOTA-v1.0, DOTA-v1.5 y HRSC2016, respectivamente. Los resultados experimentales muestran que, en comparación con los métodos del estado del arte, el método propuesto puede lograr una precisión de detección superior.
Descripción
Los objetos en imágenes aéreas a menudo tienen orientaciones arbitrarias y formas y tamaños variables. Como resultado, la detección precisa y robusta de objetos en imágenes aéreas es un problema desafiante. En este documento, se propone un método de detección de objetos orientados arbitrariamente para imágenes aéreas, basado en Convolución Deformable Dinámica (DDC) y Mecanismo de Atención de Canales Auto-normalizadores (SCAM); este método utiliza ReResNet-50 como red principal para extraer características equivariantes a la rotación. Primero, se propone DDC como reemplazo de la operación de convolución convencional en la Red Neuronal Convolucional (CNN) para hacer frente a diversas formas, tamaños y orientaciones arbitrarias de los objetos. En segundo lugar, SCAM se incrusta en la capa superior de ReResNet-50, lo que permite a la red mejorar los canales de características importantes y suprimir los irrelevantes. Finalmente, se generan Regiones de Interés de Rotación (RRoI) basadas en una Red de Propuesta de Regiones (RPN) y un Transformador de Regiones de Interés (RT), y la clasificación y regresión de cajas delimitadoras por Región de Interés Invariante a la Rotación (RiRoI Align). El método propuesto se evalúa exhaustivamente en tres conjuntos de datos de referencia públicos disponibles. La Precisión Promedio Media (mAP) puede alcanzar el 80.91%, 92.73% y 94.1% en los conjuntos de datos DOTA-v1.0, DOTA-v1.5 y HRSC2016, respectivamente. Los resultados experimentales muestran que, en comparación con los métodos del estado del arte, el método propuesto puede lograr una precisión de detección superior.