Red residual de atención triple para superresolución de imagen única
Autores: Huang, Feng; Wang, Zhifeng; Wu, Jing; Shen, Ying; Chen, Liqiong
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Red residual de atención triple para superresolución de imagen única
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Super-resolución
Redes neuronales convolucionales
Red de atención residual de tripleta
Información de alta frecuencia
Interacciones cruz-dimensionales
Información espacial
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
Las técnicas de superresolución de imagen única (SISR) se han desarrollado rápidamente con el notable progreso de las redes neuronales convolucionales (CNNs). Las técnicas anteriores de SISR basadas en CNNs se centran principalmente en el diseño de la red, ignorando las interacciones e interdependencias entre diferentes dimensiones de las características en las capas intermedias, lo que dificulta la poderosa capacidad de aprendizaje de las CNNs. Para abordar este problema de manera efectiva, se propone una red de atención de tripleta residual (RTAN) para interacciones eficientes de la información de las características. Específicamente, desarrollamos una innovadora estructura de grupo residual múltiple anidado (MNRG) para mejorar la capacidad de aprendizaje para extraer la información de alta frecuencia y entrenar una red más profunda y estable. Además, presentamos un novedoso módulo de atención de tripleta residual ligero (RTAM) para obtener los pesos de atención cruzada de las características. El RTAM combina dos bloques de interacción cruzada dimensional (CDIBs) y un bloque de atención espacial (SAB) basado en el módulo residual. Por lo tanto, el RTAM no solo es capaz de capturar las interacciones y interdependencias cruzadas de las características, sino que también utiliza la información espacial de las características. Los resultados de la simulación y el análisis muestran la superioridad de la RTAN propuesta sobre las redes SISR de última generación en términos de métricas de evaluación y resultados visuales.
Descripción
Las técnicas de superresolución de imagen única (SISR) se han desarrollado rápidamente con el notable progreso de las redes neuronales convolucionales (CNNs). Las técnicas anteriores de SISR basadas en CNNs se centran principalmente en el diseño de la red, ignorando las interacciones e interdependencias entre diferentes dimensiones de las características en las capas intermedias, lo que dificulta la poderosa capacidad de aprendizaje de las CNNs. Para abordar este problema de manera efectiva, se propone una red de atención de tripleta residual (RTAN) para interacciones eficientes de la información de las características. Específicamente, desarrollamos una innovadora estructura de grupo residual múltiple anidado (MNRG) para mejorar la capacidad de aprendizaje para extraer la información de alta frecuencia y entrenar una red más profunda y estable. Además, presentamos un novedoso módulo de atención de tripleta residual ligero (RTAM) para obtener los pesos de atención cruzada de las características. El RTAM combina dos bloques de interacción cruzada dimensional (CDIBs) y un bloque de atención espacial (SAB) basado en el módulo residual. Por lo tanto, el RTAM no solo es capaz de capturar las interacciones y interdependencias cruzadas de las características, sino que también utiliza la información espacial de las características. Los resultados de la simulación y el análisis muestran la superioridad de la RTAN propuesta sobre las redes SISR de última generación en términos de métricas de evaluación y resultados visuales.