logo móvil
Contáctanos

Autoencoder invertible para adaptación de dominio

Autores: Teng, Yunfei; Choromanska, Anna

Idioma: Inglés

Editor: MDPI

Año: 2019

Descargar PDF

Acceso abierto

Artículo científico
2019

Autoencoder invertible para adaptación de dominio


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Sistemas

Palabras clave

Traducción de imagen a imagen
No supervisado
Mapeo
Consistencia cíclica
Arquitectura profunda
Adaptación de dominio

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 31

Citaciones: Sin citaciones


Descripción
La traducción de imagen a imagen no supervisada tiene como objetivo encontrar una asignación entre los dominios de imagen de origen y destino, donde en muchas aplicaciones no se disponen de pares de imágenes alineadas durante el entrenamiento. Este es un problema de aprendizaje mal planteado, ya que requiere inferir la distribución de probabilidad conjunta a partir de marginales. El aprendizaje conjunto de asignaciones acopladas y es comúnmente utilizado por los métodos más avanzados, como CycleGAN, para aprender esta traducción al introducir el requisito de consistencia cíclica en el problema de aprendizaje, es decir, y . La consistencia cíclica impone la preservación de la información mutua entre las imágenes de entrada y traducidas. Sin embargo, no impone explícitamente que sea una operación inversa a . Proponemos una nueva arquitectura profunda que llamamos para imponer explícitamente esta relación. Esto se logra al forzar que un codificador sea una versión invertida del decodificador, donde las capas correspondientes realizan mapeos opuestos y comparten parámetros. Los mapeos están restringidos a ser ortogonales. La arquitectura resultante conduce a la reducción del número de parámetros entrenables (hasta 2 veces). Presentamos resultados de traducción de imágenes en conjuntos de datos de referencia y demostramos el rendimiento de vanguardia de nuestro enfoque. Finalmente, probamos el método propuesto de adaptación de dominio en la tarea de conversión de videos de carretera. Demostramos que los videos convertidos con InvAuto tienen alta calidad y mostramos que el sistema de aprendizaje de extremo a extremo basado en redes neuronales de NVIDIA para la conducción autónoma, conocido como PilotNet, entrenado en videos reales de carretera, funciona bien cuando se prueba en los videos convertidos.

Otros recursos que podrían interesarte

Temas Virtualpro