Método de compresión de imágenes de teledetección mejorado utilizando una red grande con estrategia de extracción dispersa
Autores: Li, Hui; Pan, Tianpeng; Zhang, Lili
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Método de compresión de imágenes de teledetección mejorado utilizando una red grande con estrategia de extracción dispersa
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Redes neuronales
Hiper-codificadores
Teledetección
Compresión de imágenes
Representaciones latentes
Extracción de características
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
Las redes neuronales profundas basadas en hiper-codificadores juegan un papel crítico en la estimación de distribuciones previas en problemas de compresión de imágenes de teledetección. Sin embargo, la mayoría de los métodos de codificación existentes sufren de un problema en el lado de hiper-codificación, a saber, la falta de coincidencia de la capacidad de extracción con el codificador. Este sesgo de capacidad resulta en características de probabilidad que no logran extraer suficiente información de las representaciones latentes. Para resolver este problema, se mejoran las capacidades de extracción de características del hiper-codificador para estimar mejor la probabilidad gaussiana de la representación latente en la optimización de la red de extremo a extremo. Específicamente, se incorporan bloques residuales y un módulo de estimación de parámetros para equilibrar el rendimiento del codificador y del hiper-codificador. Además, se observa que el modelo de compresión bien entrenado tiende a generar un patrón fijo de representaciones latentes. Por lo tanto, incorporamos un grafo cruzado no local de canales (NCG) en el lado posterior del codificador. Específicamente, agrega características entre representaciones latentes similares de manera gráfica para mejorar aún más la capacidad de extracción de información lateral del hiper-codificador. Teniendo en cuenta el costo computacional, se desarrolla aún más una estrategia de grafo disperso para seleccionar dinámicamente las representaciones latentes más relevantes para las operaciones de agregación, lo que reduce en gran medida el esfuerzo computacional. El algoritmo propuesto se llama grafo eficiente no local de canales cruzados (NCEG). Se selecciona una red residual de larga dependencia como base, y se inserta un módulo de atención dispersa en el lado del codificador/decodificador para mejorar el campo perceptual de la red. Los resultados experimentales en dos conjuntos de datos de evaluación demuestran que el método propuesto logra resultados satisfactorios en comparación con otros métodos basados en el aprendizaje.
Descripción
Las redes neuronales profundas basadas en hiper-codificadores juegan un papel crítico en la estimación de distribuciones previas en problemas de compresión de imágenes de teledetección. Sin embargo, la mayoría de los métodos de codificación existentes sufren de un problema en el lado de hiper-codificación, a saber, la falta de coincidencia de la capacidad de extracción con el codificador. Este sesgo de capacidad resulta en características de probabilidad que no logran extraer suficiente información de las representaciones latentes. Para resolver este problema, se mejoran las capacidades de extracción de características del hiper-codificador para estimar mejor la probabilidad gaussiana de la representación latente en la optimización de la red de extremo a extremo. Específicamente, se incorporan bloques residuales y un módulo de estimación de parámetros para equilibrar el rendimiento del codificador y del hiper-codificador. Además, se observa que el modelo de compresión bien entrenado tiende a generar un patrón fijo de representaciones latentes. Por lo tanto, incorporamos un grafo cruzado no local de canales (NCG) en el lado posterior del codificador. Específicamente, agrega características entre representaciones latentes similares de manera gráfica para mejorar aún más la capacidad de extracción de información lateral del hiper-codificador. Teniendo en cuenta el costo computacional, se desarrolla aún más una estrategia de grafo disperso para seleccionar dinámicamente las representaciones latentes más relevantes para las operaciones de agregación, lo que reduce en gran medida el esfuerzo computacional. El algoritmo propuesto se llama grafo eficiente no local de canales cruzados (NCEG). Se selecciona una red residual de larga dependencia como base, y se inserta un módulo de atención dispersa en el lado del codificador/decodificador para mejorar el campo perceptual de la red. Los resultados experimentales en dos conjuntos de datos de evaluación demuestran que el método propuesto logra resultados satisfactorios en comparación con otros métodos basados en el aprendizaje.