Mwirgan: traducción de imagen visible a mwir no supervisada con red generativa adversarial
Autores: Uddin, Mohammad Shahab; Kwan, Chiman; Li, Jiang
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Mwirgan: traducción de imagen visible a mwir no supervisada con red generativa adversarial
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Sin supervisión
Traducción de imagen a imagen
Visible a MWIR
GANs
Pérdida perceptual
Identificación de forma
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
Las técnicas de traducción de imagen a imagen no supervisadas se han utilizado en muchas aplicaciones, incluida la traducción de imagen visible a infrarrojo de onda larga (visible a LWIR), pero muy pocos trabajos han explorado la traducción de imagen visible a infrarrojo de onda media (visible a MWIR). En este documento, investigamos la traducción de imagen visible a MWIR no supervisada utilizando redes generativas adversarias (GAN). Propusimos un nuevo modelo llamado MWIRGAN para la traducción de imagen visible a MWIR de manera totalmente no supervisada. Utilizamos una pérdida perceptual para aprovechar la identificación de formas y los cambios de ubicación de los objetos en la traducción. Los resultados experimentales mostraron que MWIRGAN era capaz de traducir imágenes de visible a MWIR preservando la forma del objeto con un adecuado realce en las imágenes traducidas y superando a varios modelos competidores de última generación. Además, personalizamos el modelo propuesto para convertir imágenes generadas por motores de juego (un software comercial) en imágenes de MWIR. Los resultados cuantitativos mostraron que nuestro método propuesto podría generar efectivamente imágenes de MWIR a partir de imágenes generadas por motores de juego, beneficiando en gran medida la ampliación de datos de MWIR.
Descripción
Las técnicas de traducción de imagen a imagen no supervisadas se han utilizado en muchas aplicaciones, incluida la traducción de imagen visible a infrarrojo de onda larga (visible a LWIR), pero muy pocos trabajos han explorado la traducción de imagen visible a infrarrojo de onda media (visible a MWIR). En este documento, investigamos la traducción de imagen visible a MWIR no supervisada utilizando redes generativas adversarias (GAN). Propusimos un nuevo modelo llamado MWIRGAN para la traducción de imagen visible a MWIR de manera totalmente no supervisada. Utilizamos una pérdida perceptual para aprovechar la identificación de formas y los cambios de ubicación de los objetos en la traducción. Los resultados experimentales mostraron que MWIRGAN era capaz de traducir imágenes de visible a MWIR preservando la forma del objeto con un adecuado realce en las imágenes traducidas y superando a varios modelos competidores de última generación. Además, personalizamos el modelo propuesto para convertir imágenes generadas por motores de juego (un software comercial) en imágenes de MWIR. Los resultados cuantitativos mostraron que nuestro método propuesto podría generar efectivamente imágenes de MWIR a partir de imágenes generadas por motores de juego, beneficiando en gran medida la ampliación de datos de MWIR.