SE-CBAM-YOLOv7: Un mecanismo de atención ligero mejorado basado en YOLOv7 para la detección en tiempo real de objetivos de aeronaves pequeñas en imágenes de teledetección de microsatélites
Autores: Kang, Zhenping; Liao, Yurong; Du, Shuhan; Li, Haonan; Li, Zhaoming
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
SE-CBAM-YOLOv7: Un mecanismo de atención ligero mejorado basado en YOLOv7 para la detección en tiempo real de objetivos de aeronaves pequeñas en imágenes de teledetección de microsatélites
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Detección de objetivos de aeronaves en tiempo real
Basada en microsatélites
Luz visible
Teledetección
Imagenología
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 14
Citaciones: Sin citaciones
Abordar la detección de objetivos de aeronaves en tiempo real en imágenes de video de teledetección por luz visible basadas en microsatélites requiere considerar las limitaciones de la resolución de la carga útil de imagen, los complejos fondos terrestres y los cambios posicionales relativos entre la plataforma y las aeronaves. Estos factores conducen a variaciones multiescala en los objetivos de aeronaves, lo que hace que la detección en tiempo real de alta precisión de pequeños objetivos en fondos complejos sea un desafío significativo para los algoritmos de detección. Por lo tanto, este documento presenta un algoritmo de detección de objetivos de aeronaves en tiempo real para imágenes de teledetección utilizando un mecanismo de atención ligero mejorado que se basa en el marco You Only Look Once versión 7 (YOLOv7) (SE-CBAM-YOLOv7). El algoritmo propuesto reemplaza la convolución estándar (Conv) con una convolución ligera de compresión y excitación (SEConv) para reducir los parámetros computacionales y acelerar el proceso de detección de pequeños objetivos de aeronaves, mejorando así las capacidades de procesamiento en tiempo real a bordo. Además, el módulo de agrupamiento en pirámide espacial basado en SEConv y la convolución de pirámide espacial conectada (SPPCSPC) extraen características de la imagen. Mejora la precisión de detección mientras que la sección de fusión de características integra el módulo de atención híbrido del bloque de convolución (CBAM), formando el módulo de atención del bloque de convolución Concat (CBAMCAT). Además, optimiza las características de los pequeños objetivos de aeronaves en dimensiones de canal y espacio, mejorando las capacidades de fusión de características del modelo. Los experimentos en conjuntos de datos públicos de teledetección revelan que el SE-CBAM-YOLOv7 propuesto mejora la precisión de detección en un 0.5% y el valor mAP en un 1.7% en comparación con YOLOv7, mejorando significativamente la capacidad de detección de objetivos de aeronaves de tamaño pequeño en imágenes de teledetección por satélite.
Descripción
Abordar la detección de objetivos de aeronaves en tiempo real en imágenes de video de teledetección por luz visible basadas en microsatélites requiere considerar las limitaciones de la resolución de la carga útil de imagen, los complejos fondos terrestres y los cambios posicionales relativos entre la plataforma y las aeronaves. Estos factores conducen a variaciones multiescala en los objetivos de aeronaves, lo que hace que la detección en tiempo real de alta precisión de pequeños objetivos en fondos complejos sea un desafío significativo para los algoritmos de detección. Por lo tanto, este documento presenta un algoritmo de detección de objetivos de aeronaves en tiempo real para imágenes de teledetección utilizando un mecanismo de atención ligero mejorado que se basa en el marco You Only Look Once versión 7 (YOLOv7) (SE-CBAM-YOLOv7). El algoritmo propuesto reemplaza la convolución estándar (Conv) con una convolución ligera de compresión y excitación (SEConv) para reducir los parámetros computacionales y acelerar el proceso de detección de pequeños objetivos de aeronaves, mejorando así las capacidades de procesamiento en tiempo real a bordo. Además, el módulo de agrupamiento en pirámide espacial basado en SEConv y la convolución de pirámide espacial conectada (SPPCSPC) extraen características de la imagen. Mejora la precisión de detección mientras que la sección de fusión de características integra el módulo de atención híbrido del bloque de convolución (CBAM), formando el módulo de atención del bloque de convolución Concat (CBAMCAT). Además, optimiza las características de los pequeños objetivos de aeronaves en dimensiones de canal y espacio, mejorando las capacidades de fusión de características del modelo. Los experimentos en conjuntos de datos públicos de teledetección revelan que el SE-CBAM-YOLOv7 propuesto mejora la precisión de detección en un 0.5% y el valor mAP en un 1.7% en comparación con YOLOv7, mejorando significativamente la capacidad de detección de objetivos de aeronaves de tamaño pequeño en imágenes de teledetección por satélite.