logo móvil
Contáctanos

Yolo-gcrs: un algoritmo de detección de objetos en imágenes de teledetección que incorpora un mecanismo de atención contextual global

Autores: Liao, Huan; Zhu, Wenqiu

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Yolo-gcrs: un algoritmo de detección de objetos en imágenes de teledetección que incorpora un mecanismo de atención contextual global


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Avances significativos
Tecnología de aprendizaje profundo
Procesamiento de imágenes de teledetección
Detección de objetos
Algoritmo YOLO-GCRS
Bloque de Contexto Global

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 45

Citaciones: Sin citaciones


Descripción
Con los avances significativos en la tecnología de aprendizaje profundo, el dominio del procesamiento de imágenes de teledetección ha presenciado un aumento de atención, especialmente en el campo de la detección de objetos. La detección de objetivos en imágenes detectadas de forma remota es una tarea desafiante, principalmente debido a la abundancia de objetivos de tamaño pequeño y su distribución multi-escala. Estos desafíos a menudo resultan en una detección de objetos inexacta, lo que lleva tanto a detecciones perdidas como a falsos positivos. Para superar estos problemas, este artículo presenta un algoritmo novedoso llamado YOLO-GCRS. Este algoritmo se basa en el algoritmo YOLOv5s original al mejorar la capacidad de captura de características de la red principal. Esta mejora se logra mediante la integración de un nuevo módulo, el Bloque de Contexto Global (GC-C3), con la red principal C3. Además, el algoritmo incorpora un bloque convoluto conocido como CBM (Convolución + BatchNormalization + Mish) para mejorar la capacidad del modelo de red de extraer características de profundidad. Además, se propone una cabeza de detección, ECAHead, que integra un canal de atención eficiente (ECA) para extraer características de alta dimensión de las imágenes. Logra valores de precisión, recall y mAP@0.5 más altos (98.3%, 94.7% y 97.7%, respectivamente) en el conjunto de datos RSOD disponible públicamente en comparación con el algoritmo YOLOv5s original (mejorando en 5.3%, 0.8% y 2.7%, respectivamente). Además, en comparación con algoritmos de detección principales como YOLOv7-tiny y YOLOv8s, el algoritmo propuesto muestra mejoras de 2.0% y 7.5%, respectivamente, en mAP@0.5. Estos resultados validan la efectividad de nuestro algoritmo YOLO-GCRS para abordar los desafíos de detecciones perdidas y falsas en la detección de objetos de teledetección.

Otros recursos que podrían interesarte

Temas Virtualpro