Yolo-gcrs: un algoritmo de detección de objetos en imágenes de teledetección que incorpora un mecanismo de atención contextual global
Autores: Liao, Huan; Zhu, Wenqiu
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Yolo-gcrs: un algoritmo de detección de objetos en imágenes de teledetección que incorpora un mecanismo de atención contextual global
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Avances significativos
Tecnología de aprendizaje profundo
Procesamiento de imágenes de teledetección
Detección de objetos
Algoritmo YOLO-GCRS
Bloque de Contexto Global
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 45
Citaciones: Sin citaciones
Con los avances significativos en la tecnología de aprendizaje profundo, el dominio del procesamiento de imágenes de teledetección ha presenciado un aumento de atención, especialmente en el campo de la detección de objetos. La detección de objetivos en imágenes detectadas de forma remota es una tarea desafiante, principalmente debido a la abundancia de objetivos de tamaño pequeño y su distribución multi-escala. Estos desafíos a menudo resultan en una detección de objetos inexacta, lo que lleva tanto a detecciones perdidas como a falsos positivos. Para superar estos problemas, este artículo presenta un algoritmo novedoso llamado YOLO-GCRS. Este algoritmo se basa en el algoritmo YOLOv5s original al mejorar la capacidad de captura de características de la red principal. Esta mejora se logra mediante la integración de un nuevo módulo, el Bloque de Contexto Global (GC-C3), con la red principal C3. Además, el algoritmo incorpora un bloque convoluto conocido como CBM (Convolución + BatchNormalization + Mish) para mejorar la capacidad del modelo de red de extraer características de profundidad. Además, se propone una cabeza de detección, ECAHead, que integra un canal de atención eficiente (ECA) para extraer características de alta dimensión de las imágenes. Logra valores de precisión, recall y mAP@0.5 más altos (98.3%, 94.7% y 97.7%, respectivamente) en el conjunto de datos RSOD disponible públicamente en comparación con el algoritmo YOLOv5s original (mejorando en 5.3%, 0.8% y 2.7%, respectivamente). Además, en comparación con algoritmos de detección principales como YOLOv7-tiny y YOLOv8s, el algoritmo propuesto muestra mejoras de 2.0% y 7.5%, respectivamente, en mAP@0.5. Estos resultados validan la efectividad de nuestro algoritmo YOLO-GCRS para abordar los desafíos de detecciones perdidas y falsas en la detección de objetos de teledetección.
Descripción
Con los avances significativos en la tecnología de aprendizaje profundo, el dominio del procesamiento de imágenes de teledetección ha presenciado un aumento de atención, especialmente en el campo de la detección de objetos. La detección de objetivos en imágenes detectadas de forma remota es una tarea desafiante, principalmente debido a la abundancia de objetivos de tamaño pequeño y su distribución multi-escala. Estos desafíos a menudo resultan en una detección de objetos inexacta, lo que lleva tanto a detecciones perdidas como a falsos positivos. Para superar estos problemas, este artículo presenta un algoritmo novedoso llamado YOLO-GCRS. Este algoritmo se basa en el algoritmo YOLOv5s original al mejorar la capacidad de captura de características de la red principal. Esta mejora se logra mediante la integración de un nuevo módulo, el Bloque de Contexto Global (GC-C3), con la red principal C3. Además, el algoritmo incorpora un bloque convoluto conocido como CBM (Convolución + BatchNormalization + Mish) para mejorar la capacidad del modelo de red de extraer características de profundidad. Además, se propone una cabeza de detección, ECAHead, que integra un canal de atención eficiente (ECA) para extraer características de alta dimensión de las imágenes. Logra valores de precisión, recall y mAP@0.5 más altos (98.3%, 94.7% y 97.7%, respectivamente) en el conjunto de datos RSOD disponible públicamente en comparación con el algoritmo YOLOv5s original (mejorando en 5.3%, 0.8% y 2.7%, respectivamente). Además, en comparación con algoritmos de detección principales como YOLOv7-tiny y YOLOv8s, el algoritmo propuesto muestra mejoras de 2.0% y 7.5%, respectivamente, en mAP@0.5. Estos resultados validan la efectividad de nuestro algoritmo YOLO-GCRS para abordar los desafíos de detecciones perdidas y falsas en la detección de objetos de teledetección.