logo móvil
Contáctanos

Método de desenfoque de texto de imagen basado en red generativa adversarial

Autores: Wu, Chunxue; Du, Haiyan; Wu, Qunhui; Zhang, Sheng

Idioma: Inglés

Editor: MDPI

Año: 2020

Descargar PDF

Acceso abierto

Artículo científico
2020

Método de desenfoque de texto de imagen basado en red generativa adversarial


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Proceso de clasificación
Entrega rápida
Método de desenfoque de texto de imagen
Red generativa adversaria
Distancia de Wasserstein
Pérdida adversaria

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 20

Citaciones: Sin citaciones


Descripción
En el proceso de clasificación automática de la entrega express, se utiliza un código de tres segmentos para representar un área específica asignada por una persona de entrega específica. En el proceso de obtención de la información del pedido del mensajero, la cámara se ve afectada por factores como la luz, el ruido y el movimiento del sujeto, lo que provocará que la información del pedido del mensajero se vuelva borrosa y se pierda parte de la información. Por lo tanto, este documento propone un método de desenfoque de texto de imagen basado en una red generativa adversaria. El modelo del algoritmo consta de dos redes generativas adversarias, combinadas con la distancia de Wasserstein, utilizando una combinación de pérdida adversarial y pérdida perceptual en conjuntos de datos no emparejados para entrenar el modelo de red para restaurar las imágenes borrosas capturadas en imágenes claras y naturales. En comparación con el método tradicional, la ventaja de este método es que la función de pérdida entre las imágenes de entrada y salida se puede calcular indirectamente a través de las redes generativas adversarias positivas y negativas. La distancia de Wasserstein puede lograr un proceso de entrenamiento más estable y un efecto de generación más realista. Las restricciones de pérdida adversarial y pérdida perceptual hacen que el modelo sea capaz de entrenar en conjuntos de datos no emparejados. Los resultados experimentales en el conjunto de datos de prueba GOPRO y en el conjunto de datos no emparejados autoconstruido mostraron que los dos indicadores, pico de relación señal-ruido (PSNR) e índice de similitud estructural (SSIM), aumentaron en un 13,3% y un 3%, respectivamente. Los resultados de la prueba de percepción humana demostraron que el algoritmo propuesto en este documento fue mejor que el algoritmo de desenfoque tradicional, ya que el efecto de desenfoque era mejor.

Otros recursos que podrían interesarte

Temas Virtualpro