Red híbrida de convolución que combina la convolución separable en profundidad 3D y el control de campo receptivo para la clasificación de imágenes hiperespectrales
Autores: Lin, Chengle; Wang, Tingyu; Dong, Shuyan; Zhang, Qizhong; Yang, Zhangyi; Gao, Farong
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Red híbrida de convolución que combina la convolución separable en profundidad 3D y el control de campo receptivo para la clasificación de imágenes hiperespectrales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aprendizaje profundo
Clasificación de imágenes hiperespectrales
Red de control receptivo ligera en 3D
Red convolucional
Técnica de separación profunda
Precisión de clasificación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
Los métodos basados en aprendizaje profundo han sido ampliamente utilizados en la clasificación de imágenes hiperespectrales. Con el fin de resolver los problemas de los parámetros excesivos y el costo computacional de la convolución 3D, y la pérdida de información detallada debido al aumento excesivo en el campo receptivo en la búsqueda de características a múltiples escalas, este artículo propone una red convolucional híbrida ligera llamada red de control receptivo 3D ligera (LRCNet). La red propuesta consta de una red convolucional 3D separable en profundidad y una red de control de campo receptivo. La red convolucional 3D separable en profundidad utiliza la técnica separable en profundidad para capturar las características conjuntas de las dimensiones espaciales y espectrales mientras reduce el número de parámetros computacionales. La red de control de campo receptivo asegura la extracción de detalles de la imagen hiperespectral (HSI) controlando el núcleo de convolución. Para verificar la validez del método propuesto, probamos la precisión de clasificación de LRCNet basada en tres conjuntos de datos públicos, que supera el 99.50%. Los resultados muestran que en comparación con los métodos de vanguardia, la red propuesta tiene un rendimiento de clasificación competitivo.
Descripción
Los métodos basados en aprendizaje profundo han sido ampliamente utilizados en la clasificación de imágenes hiperespectrales. Con el fin de resolver los problemas de los parámetros excesivos y el costo computacional de la convolución 3D, y la pérdida de información detallada debido al aumento excesivo en el campo receptivo en la búsqueda de características a múltiples escalas, este artículo propone una red convolucional híbrida ligera llamada red de control receptivo 3D ligera (LRCNet). La red propuesta consta de una red convolucional 3D separable en profundidad y una red de control de campo receptivo. La red convolucional 3D separable en profundidad utiliza la técnica separable en profundidad para capturar las características conjuntas de las dimensiones espaciales y espectrales mientras reduce el número de parámetros computacionales. La red de control de campo receptivo asegura la extracción de detalles de la imagen hiperespectral (HSI) controlando el núcleo de convolución. Para verificar la validez del método propuesto, probamos la precisión de clasificación de LRCNet basada en tres conjuntos de datos públicos, que supera el 99.50%. Los resultados muestran que en comparación con los métodos de vanguardia, la red propuesta tiene un rendimiento de clasificación competitivo.