logo móvil
Contáctanos

Método de compresión de imágenes de teledetección mejorado utilizando una red grande con estrategia de extracción dispersa

Autores: Li, Hui; Pan, Tianpeng; Zhang, Lili

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Método de compresión de imágenes de teledetección mejorado utilizando una red grande con estrategia de extracción dispersa


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Redes neuronales
Hiper-codificadores
Teledetección
Compresión de imágenes
Representaciones latentes
Extracción de características

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 31

Citaciones: Sin citaciones


Descripción
Las redes neuronales profundas basadas en hiper-codificadores juegan un papel crítico en la estimación de distribuciones previas en problemas de compresión de imágenes de teledetección. Sin embargo, la mayoría de los métodos de codificación existentes sufren de un problema en el lado de hiper-codificación, a saber, la falta de coincidencia de la capacidad de extracción con el codificador. Este sesgo de capacidad resulta en características de probabilidad que no logran extraer suficiente información de las representaciones latentes. Para resolver este problema, se mejoran las capacidades de extracción de características del hiper-codificador para estimar mejor la probabilidad gaussiana de la representación latente en la optimización de la red de extremo a extremo. Específicamente, se incorporan bloques residuales y un módulo de estimación de parámetros para equilibrar el rendimiento del codificador y del hiper-codificador. Además, se observa que el modelo de compresión bien entrenado tiende a generar un patrón fijo de representaciones latentes. Por lo tanto, incorporamos un grafo cruzado no local de canales (NCG) en el lado posterior del codificador. Específicamente, agrega características entre representaciones latentes similares de manera gráfica para mejorar aún más la capacidad de extracción de información lateral del hiper-codificador. Teniendo en cuenta el costo computacional, se desarrolla aún más una estrategia de grafo disperso para seleccionar dinámicamente las representaciones latentes más relevantes para las operaciones de agregación, lo que reduce en gran medida el esfuerzo computacional. El algoritmo propuesto se llama grafo eficiente no local de canales cruzados (NCEG). Se selecciona una red residual de larga dependencia como base, y se inserta un módulo de atención dispersa en el lado del codificador/decodificador para mejorar el campo perceptual de la red. Los resultados experimentales en dos conjuntos de datos de evaluación demuestran que el método propuesto logra resultados satisfactorios en comparación con otros métodos basados en el aprendizaje.

Otros recursos que podrían interesarte

Temas Virtualpro