Eficiente imitación de imagen para eliminación de texto manuscrito utilizando el marco CycleGAN
Autores: Maiti, Somanka; Nath Panuganti, Shabari; Bhatnagar, Gaurav; Wu, Jonathan
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Eficiente imitación de imagen para eliminación de texto manuscrito utilizando el marco CycleGAN
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Subir
Técnicas de aprendizaje profundo
Inpainting de imágenes
áreas faltantes
Ocultaciones manuscritas
CycleGAN
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
Con el reciente aumento en el desarrollo de técnicas de aprendizaje profundo, el rellenado de imágenes, el proceso de restaurar regiones faltantes o corruptas en imágenes, ha presenciado avances significativos. Aunque los modelos de última generación son efectivos, a menudo fallan al rellenar áreas faltantes complejas, especialmente cuando hay oclusiones manuscritas presentes en la imagen. Para abordar este problema, se propone un modelo de rellenado de imágenes basado en un residual CycleGAN. El generador toma como entrada la imagen oculta por parches faltantes manuscritos y genera una imagen restaurada, la cual el discriminador luego compara con la imagen original de verdad para determinar si es real o falsa. Un conflicto adversarial entre el generador y el discriminador motiva al modelo a mejorar su entrenamiento y producir una imagen reconstruida superior. Experimentos extensos y análisis confirman que el método propuesto genera imágenes rellenadas con una calidad visual superior y supera a los enfoques de aprendizaje profundo de última generación.
Descripción
Con el reciente aumento en el desarrollo de técnicas de aprendizaje profundo, el rellenado de imágenes, el proceso de restaurar regiones faltantes o corruptas en imágenes, ha presenciado avances significativos. Aunque los modelos de última generación son efectivos, a menudo fallan al rellenar áreas faltantes complejas, especialmente cuando hay oclusiones manuscritas presentes en la imagen. Para abordar este problema, se propone un modelo de rellenado de imágenes basado en un residual CycleGAN. El generador toma como entrada la imagen oculta por parches faltantes manuscritos y genera una imagen restaurada, la cual el discriminador luego compara con la imagen original de verdad para determinar si es real o falsa. Un conflicto adversarial entre el generador y el discriminador motiva al modelo a mejorar su entrenamiento y producir una imagen reconstruida superior. Experimentos extensos y análisis confirman que el método propuesto genera imágenes rellenadas con una calidad visual superior y supera a los enfoques de aprendizaje profundo de última generación.