Función de densidad de probabilidad Distance-Based Augmented CycleGAN para la traducción de dominio de imágenes con tamaño de muestra asimétrico
Autores: Krstanovi, Lidija; Popovi, Branislav; Balo, Sebastian; Narandi, Milan; Brklja, Branko
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Función de densidad de probabilidad Distance-Based Augmented CycleGAN para la traducción de dominio de imágenes con tamaño de muestra asimétrico
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Tareas de traducción de imagen a imagen
Asimetría en los dominios
CycleGAN
Aumento basado en la distancia pdf
Red discriminadora
Dominio escaso
Resultados competitivos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
Muchas tareas de traducción de imagen a imagen enfrentan un problema inherente de asimetría en los dominios, lo que significa que uno de los dominios es escaso, es decir, contiene significativamente menos datos de entrenamiento disponibles en comparación con el otro dominio. Solo hay unos pocos métodos propuestos en la literatura que abordan el problema de entrenar un CycleGAN en dicho entorno. En este artículo, proponemos un método novedoso que utiliza la distancia basada en la función de densidad de probabilidad (pdf) para aumentar la red del discriminador correspondiente al dominio escaso. Específicamente, el método implica agregar ejemplos traducidos del dominio no escaso al conjunto de datos del discriminador correspondiente al dominio escaso, pero solo aquellos ejemplos para los cuales se asume que la pdf gaussiana en el espacio de características de la red VGG19 es lo suficientemente cercana a la pdf de GMM que representa el conjunto de datos inicial relevante en el mismo espacio de características. En experimentos con varios conjuntos de datos, el método propuesto mostró características significativamente mejoradas en comparación con un CycleGAN no supervisado estándar, así como con un CycleGAN SSL con Bootstrap, donde se agregan ejemplos traducidos al conjunto de datos del discriminador correspondiente al dominio escaso, sin discriminación alguna. Además, en los escenarios escasos considerados, también muestra resultados competitivos en comparación con la traducción de imagen a imagen completamente supervisada basada en el método pix2pix.
Descripción
Muchas tareas de traducción de imagen a imagen enfrentan un problema inherente de asimetría en los dominios, lo que significa que uno de los dominios es escaso, es decir, contiene significativamente menos datos de entrenamiento disponibles en comparación con el otro dominio. Solo hay unos pocos métodos propuestos en la literatura que abordan el problema de entrenar un CycleGAN en dicho entorno. En este artículo, proponemos un método novedoso que utiliza la distancia basada en la función de densidad de probabilidad (pdf) para aumentar la red del discriminador correspondiente al dominio escaso. Específicamente, el método implica agregar ejemplos traducidos del dominio no escaso al conjunto de datos del discriminador correspondiente al dominio escaso, pero solo aquellos ejemplos para los cuales se asume que la pdf gaussiana en el espacio de características de la red VGG19 es lo suficientemente cercana a la pdf de GMM que representa el conjunto de datos inicial relevante en el mismo espacio de características. En experimentos con varios conjuntos de datos, el método propuesto mostró características significativamente mejoradas en comparación con un CycleGAN no supervisado estándar, así como con un CycleGAN SSL con Bootstrap, donde se agregan ejemplos traducidos al conjunto de datos del discriminador correspondiente al dominio escaso, sin discriminación alguna. Además, en los escenarios escasos considerados, también muestra resultados competitivos en comparación con la traducción de imagen a imagen completamente supervisada basada en el método pix2pix.