Detección de cambios de imagen de alta resolución en teledetección basada en la Red de Atención de Mezcla Cruzada
Autores: Wu, Chaoyang; Yang, Le; Guo, Cunge; Wu, Xiaosuo
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Detección de cambios de imagen de alta resolución en teledetección basada en la Red de Atención de Mezcla Cruzada
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Potentes
Redes neuronales convolucionales
Detección de cambios
Dependencias espacio-temporales
Módulo de alineación de características
Red de atención de mezcla cruzada
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
Con las potentes capacidades discriminativas de las redes neuronales convolucionales, la detección de cambios ha logrado un éxito significativo. Sin embargo, los métodos actuales suelen ignorar las dependencias espacio-temporales entre las imágenes duales temporales o sufren de una disminución en la precisión debido a errores de registro. Para abordar estos desafíos, este documento propone un método para la detección de cambios en imágenes de teledetección basado en la red de atención de mezcla cruzada. Para minimizar el impacto de los errores de registro en los resultados de la detección de cambios, se desarrolla específicamente en este estudio un módulo de alineación de características (FAM). El FAM realiza transformaciones espaciales en mapas de características duales temporales, logrando la alineación espacial precisa de pares de características y reduciendo las tasas de falsos positivos en la detección de cambios. Además, para aprovechar completamente las relaciones espacio-temporales entre las imágenes duales temporales, se utiliza un módulo de atención de mezcla cruzada (CMAM) para extraer información de canal global, mejorando las capacidades de selección de características. Además, se crean mapas de atención para guiar el proceso de aumento de muestreo, optimizando la información de características. Experimentos exhaustivos realizados en los conjuntos de datos de detección de cambios LEVIR-CD y SYSU-CD demuestran que el modelo propuesto logra puntuaciones F1 del 91,06% y 81,88%, respectivamente, superando a otros modelos comparativos. En conclusión, el modelo propuesto mantiene un buen rendimiento en dos conjuntos de datos y, por lo tanto, tiene una buena aplicabilidad en diversas tareas de detección de cambios.
Descripción
Con las potentes capacidades discriminativas de las redes neuronales convolucionales, la detección de cambios ha logrado un éxito significativo. Sin embargo, los métodos actuales suelen ignorar las dependencias espacio-temporales entre las imágenes duales temporales o sufren de una disminución en la precisión debido a errores de registro. Para abordar estos desafíos, este documento propone un método para la detección de cambios en imágenes de teledetección basado en la red de atención de mezcla cruzada. Para minimizar el impacto de los errores de registro en los resultados de la detección de cambios, se desarrolla específicamente en este estudio un módulo de alineación de características (FAM). El FAM realiza transformaciones espaciales en mapas de características duales temporales, logrando la alineación espacial precisa de pares de características y reduciendo las tasas de falsos positivos en la detección de cambios. Además, para aprovechar completamente las relaciones espacio-temporales entre las imágenes duales temporales, se utiliza un módulo de atención de mezcla cruzada (CMAM) para extraer información de canal global, mejorando las capacidades de selección de características. Además, se crean mapas de atención para guiar el proceso de aumento de muestreo, optimizando la información de características. Experimentos exhaustivos realizados en los conjuntos de datos de detección de cambios LEVIR-CD y SYSU-CD demuestran que el modelo propuesto logra puntuaciones F1 del 91,06% y 81,88%, respectivamente, superando a otros modelos comparativos. En conclusión, el modelo propuesto mantiene un buen rendimiento en dos conjuntos de datos y, por lo tanto, tiene una buena aplicabilidad en diversas tareas de detección de cambios.