AMamNet: Red Mamba Mejorada por Atención para la Clasificación de Imágenes de Teledetección Hiperespectral
Autores: Liu, Chunjiang; Wang, Feng; Jia, Qinglei; Liu, Li; Zhang, Tianxiang
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
AMamNet: Red Mamba Mejorada por Atención para la Clasificación de Imágenes de Teledetección Hiperespectral
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Astronomía
Palabras clave
Imágenes hiperespectrales
Redes neuronales convolucionales
Transformadores de visión
Modelos de espacio de estados
Mecanismos de atención
Características espaciales-espectrales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 9
Citaciones: Sin citaciones
La imagen hiperespectral, una tecnología clave en la teledetección, captura información espectral rica más allá del espectro visible, lo que la hace indispensable para tareas avanzadas de clasificación. Sin embargo, con los desarrollos en la imagen hiperespectral, la redundancia espacial-espectral y la confusión espectral han revelado cada vez más las limitaciones de las redes neuronales convolucionales (CNN) y los transformadores de visión (ViT). Los avances recientes en modelos de espacio de estado (SSM) han demostrado su superioridad en modelado lineal en comparación con enfoques basados en convoluciones y transformadores. Basado en esta base, este estudio propone un modelo llamado AMamNet que integra mecanismos de convolución y atención con SSM. Como componente central de AMamNet, el Bloque Mamba Bidireccional de Atención aprovecha el mecanismo de autoatención para capturar dependencias inter-espectrales, mientras que los SSM mejoran la extracción de características secuenciales, gestionando efectivamente la naturaleza continua de las bandas espectrales de imágenes hiperespectrales. Técnicamente, se diseña un bloque de tallo de convolución multiescala para lograr una fusión de características espaciales-espectrales superficiales y reducir la redundancia de información. Experimentos extensos realizados en tres conjuntos de datos de referencia, a saber, el conjunto de datos Indian Pines, el conjunto de datos de la Universidad de Pavía y el conjunto de datos WHU-Hi-LongKou, demuestran que AMamNet logra un rendimiento robusto y de vanguardia, subrayando su efectividad en la mitigación de la redundancia y la confusión dentro de las características espaciales-espectrales de las imágenes hiperespectrales.
Descripción
La imagen hiperespectral, una tecnología clave en la teledetección, captura información espectral rica más allá del espectro visible, lo que la hace indispensable para tareas avanzadas de clasificación. Sin embargo, con los desarrollos en la imagen hiperespectral, la redundancia espacial-espectral y la confusión espectral han revelado cada vez más las limitaciones de las redes neuronales convolucionales (CNN) y los transformadores de visión (ViT). Los avances recientes en modelos de espacio de estado (SSM) han demostrado su superioridad en modelado lineal en comparación con enfoques basados en convoluciones y transformadores. Basado en esta base, este estudio propone un modelo llamado AMamNet que integra mecanismos de convolución y atención con SSM. Como componente central de AMamNet, el Bloque Mamba Bidireccional de Atención aprovecha el mecanismo de autoatención para capturar dependencias inter-espectrales, mientras que los SSM mejoran la extracción de características secuenciales, gestionando efectivamente la naturaleza continua de las bandas espectrales de imágenes hiperespectrales. Técnicamente, se diseña un bloque de tallo de convolución multiescala para lograr una fusión de características espaciales-espectrales superficiales y reducir la redundancia de información. Experimentos extensos realizados en tres conjuntos de datos de referencia, a saber, el conjunto de datos Indian Pines, el conjunto de datos de la Universidad de Pavía y el conjunto de datos WHU-Hi-LongKou, demuestran que AMamNet logra un rendimiento robusto y de vanguardia, subrayando su efectividad en la mitigación de la redundancia y la confusión dentro de las características espaciales-espectrales de las imágenes hiperespectrales.