Evaluando técnicas de aprendizaje profundo para superresolución de imágenes ciegas dentro de una perspectiva multi-dominio a gran escala
Autores: de Santiago Júnior, Valdivino Alexandre
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Evaluando técnicas de aprendizaje profundo para superresolución de imágenes ciegas dentro de una perspectiva multi-dominio a gran escala
Categoría
Ingeniería y Tecnología
Subcategoría
Inteligencia Artificial
Palabras clave
Soluciones
Experimentos
Super-resolución de imágenes
Aprendizaje profundo
SR ciego
Imágenes LR
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
A pesar de que recientemente se han llevado a cabo varias soluciones y experimentos que abordan la superresolución de imágenes (SR), potenciados por el aprendizaje profundo (DL), no suelen diseñar evaluaciones con factores de escalado altos. Además, los conjuntos de datos suelen ser benchmarks que no abarcan verdaderamente una diversidad significativa de dominios para evaluar adecuadamente las técnicas. También es interesante destacar que la SR ciega es atractiva para escenarios del mundo real, ya que se basa en la idea de que el proceso de degradación es desconocido y, por lo tanto, las técnicas en este contexto se basan básicamente en imágenes de baja resolución (LR). En este artículo, presentamos un experimento de alta escala (8x) que evalúa cinco técnicas recientes de DL adaptadas para la SR ciega de imágenes: Aumentación Pseudo Adaptativa (APA), SR de Imágenes Ciegas con Degradaciones Espacialmente Variables (BlindSR), Red Alternante Profunda (DAN), FastGAN y Super-Resolución de Mezcla de Expertos (MoESR). Consideramos 14 conjuntos de datos de cinco dominios más amplios diferentes (Aéreo, Fauna, Flora, Médico y Satélite), y otra observación es que algunos de los enfoques de DL fueron diseñados para SR de una sola imagen pero otros no. Según dos métricas sin referencia, NIQE y la puntuación MANIQA basada en transformadores, MoESR puede considerarse como la mejor solución aunque la calidad perceptual de las imágenes de alta resolución (HR) creadas por todas las técnicas aún necesita mejorar.
Descripción
A pesar de que recientemente se han llevado a cabo varias soluciones y experimentos que abordan la superresolución de imágenes (SR), potenciados por el aprendizaje profundo (DL), no suelen diseñar evaluaciones con factores de escalado altos. Además, los conjuntos de datos suelen ser benchmarks que no abarcan verdaderamente una diversidad significativa de dominios para evaluar adecuadamente las técnicas. También es interesante destacar que la SR ciega es atractiva para escenarios del mundo real, ya que se basa en la idea de que el proceso de degradación es desconocido y, por lo tanto, las técnicas en este contexto se basan básicamente en imágenes de baja resolución (LR). En este artículo, presentamos un experimento de alta escala (8x) que evalúa cinco técnicas recientes de DL adaptadas para la SR ciega de imágenes: Aumentación Pseudo Adaptativa (APA), SR de Imágenes Ciegas con Degradaciones Espacialmente Variables (BlindSR), Red Alternante Profunda (DAN), FastGAN y Super-Resolución de Mezcla de Expertos (MoESR). Consideramos 14 conjuntos de datos de cinco dominios más amplios diferentes (Aéreo, Fauna, Flora, Médico y Satélite), y otra observación es que algunos de los enfoques de DL fueron diseñados para SR de una sola imagen pero otros no. Según dos métricas sin referencia, NIQE y la puntuación MANIQA basada en transformadores, MoESR puede considerarse como la mejor solución aunque la calidad perceptual de las imágenes de alta resolución (HR) creadas por todas las técnicas aún necesita mejorar.