Imagen de alta resolución ligera basada en la interacción local de características de múltiples escalas y fusión global
Autores: Meng, Zhiqing; Zhang, Jing; Li, Xiangjun; Zhang, Lingyin
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Imagen de alta resolución ligera basada en la interacción local de características de múltiples escalas y fusión global
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Visión por computadora
Super resolución
Red neuronal convolucional
Red de reconstrucción de imagen
Bloque de interacción de características a múltiples escalas
Conjuntos de datos de referencia
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
En los últimos años, la tecnología de visión por computadora se ha aplicado ampliamente en diversos campos, convirtiendo a la super resolución (SR), una tarea visual de bajo nivel, en un tema de investigación candente. Aunque la red neuronal convolucional profunda ha tenido avances significativos en el campo de la super resolución de imágenes individuales (SISR), su adaptabilidad a dispositivos interactivos en tiempo real que requieren respuestas rápidas es deficiente debido a la cantidad excesiva de parámetros del modelo de red, al largo tiempo de inferencia de la imagen y al modelo de entrenamiento complejo. Para resolver este problema, proponemos una red de reconstrucción de imágenes ligera (MSFN) para la interacción local de características a múltiples escalas basada en la conexión global del canal de características locales. Luego, desarrollamos un bloque de interacción de características a múltiples escalas (FIB) en MSFN para extraer completamente la información espacial de diferentes regiones de la imagen original utilizando capas convolucionales de diferentes escalas. Sobre esta base, utilizamos la operación de eliminación de canales para comprimir el modelo y reducir el número de parámetros del modelo tanto como sea posible, garantizando la calidad de la imagen reconstruida. Finalmente, probamos el modelo MSFN propuesto con conjuntos de datos de referencia. Los resultados experimentales muestran que el modelo MSFN es mejor que otros métodos de SR de última generación en efecto de reconstrucción, complejidad computacional y tiempo de inferencia.
Descripción
En los últimos años, la tecnología de visión por computadora se ha aplicado ampliamente en diversos campos, convirtiendo a la super resolución (SR), una tarea visual de bajo nivel, en un tema de investigación candente. Aunque la red neuronal convolucional profunda ha tenido avances significativos en el campo de la super resolución de imágenes individuales (SISR), su adaptabilidad a dispositivos interactivos en tiempo real que requieren respuestas rápidas es deficiente debido a la cantidad excesiva de parámetros del modelo de red, al largo tiempo de inferencia de la imagen y al modelo de entrenamiento complejo. Para resolver este problema, proponemos una red de reconstrucción de imágenes ligera (MSFN) para la interacción local de características a múltiples escalas basada en la conexión global del canal de características locales. Luego, desarrollamos un bloque de interacción de características a múltiples escalas (FIB) en MSFN para extraer completamente la información espacial de diferentes regiones de la imagen original utilizando capas convolucionales de diferentes escalas. Sobre esta base, utilizamos la operación de eliminación de canales para comprimir el modelo y reducir el número de parámetros del modelo tanto como sea posible, garantizando la calidad de la imagen reconstruida. Finalmente, probamos el modelo MSFN propuesto con conjuntos de datos de referencia. Los resultados experimentales muestran que el modelo MSFN es mejor que otros métodos de SR de última generación en efecto de reconstrucción, complejidad computacional y tiempo de inferencia.