La ampliación de datos basada en una red generativa adversarial con un mecanismo de atención mixto
Autores: Yang, Yu; Sun, Lei; Mao, Xiuqing; Zhao, Min
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
La ampliación de datos basada en una red generativa adversarial con un mecanismo de atención mixto
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aumento de datos
Red generativa adversaria
Mecanismo de atención mixta
Normalización espectral
Restricción de Lipschitz
Benchmarks a pequeña escala
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
Algunas tareas posteriores a menudo requieren suficientes datos para el entrenamiento en aprendizaje profundo, pero es formidable adquirir datos en algunos campos particulares. La Red Generativa Adversaria ha sido ampliamente utilizada en la ampliación de datos. Sin embargo, aún tiene problemas de entrenamiento inestable y baja calidad de las imágenes generadas. Este documento propuso la Ampliación de Datos Basada en la Red Generativa Adversaria con Mecanismo de Atención Mixta (MA-GAN) para resolver esos problemas. Este método puede generar objetos o escenas consistentes correlacionando las características remotas en la imagen, mejorando así la capacidad de crear detalles. En primer lugar, se añaden el mecanismo de atención de canal y la autoatención al generador y al discriminador. Luego, se introduce la normalización espectral en el generador y el discriminador para que la matriz de parámetros cumpla con la restricción de Lipschitz, mejorando así la estabilidad del proceso de entrenamiento del modelo. Mediante evaluaciones cualitativas y cuantitativas en benchmarks de pequeña escala (CelebA, MNIST y CIFAR-10), los resultados experimentales muestran que el método propuesto funciona mejor que otros métodos. En comparación con WGAN-GP (Entrenamiento Mejorado de GANs de Wasserstein) y SAGAN (Redes Generativas Adversarias de Autoatención), el método propuesto contribuye a una mayor precisión en la clasificación, lo que indica que este método puede aumentar efectivamente los datos de muestras pequeñas.
Descripción
Algunas tareas posteriores a menudo requieren suficientes datos para el entrenamiento en aprendizaje profundo, pero es formidable adquirir datos en algunos campos particulares. La Red Generativa Adversaria ha sido ampliamente utilizada en la ampliación de datos. Sin embargo, aún tiene problemas de entrenamiento inestable y baja calidad de las imágenes generadas. Este documento propuso la Ampliación de Datos Basada en la Red Generativa Adversaria con Mecanismo de Atención Mixta (MA-GAN) para resolver esos problemas. Este método puede generar objetos o escenas consistentes correlacionando las características remotas en la imagen, mejorando así la capacidad de crear detalles. En primer lugar, se añaden el mecanismo de atención de canal y la autoatención al generador y al discriminador. Luego, se introduce la normalización espectral en el generador y el discriminador para que la matriz de parámetros cumpla con la restricción de Lipschitz, mejorando así la estabilidad del proceso de entrenamiento del modelo. Mediante evaluaciones cualitativas y cuantitativas en benchmarks de pequeña escala (CelebA, MNIST y CIFAR-10), los resultados experimentales muestran que el método propuesto funciona mejor que otros métodos. En comparación con WGAN-GP (Entrenamiento Mejorado de GANs de Wasserstein) y SAGAN (Redes Generativas Adversarias de Autoatención), el método propuesto contribuye a una mayor precisión en la clasificación, lo que indica que este método puede aumentar efectivamente los datos de muestras pequeñas.