Mejora de la conversión de imágenes de noche a día utilizando un entrenamiento emparejado de base-detalle basado en CycleGAN
Autores: Son, Dong-Min; Kwon, Hyuk-Ju; Lee, Sung-Hak
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Mejora de la conversión de imágenes de noche a día utilizando un entrenamiento emparejado de base-detalle basado en CycleGAN
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Estudios
Imágenes nocturnas
Imágenes diurnas
Visibilidad
Procesamiento de imágenes
Conversión de imágenes
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
Numerosos estudios están en marcha para mejorar la identificación de los alrededores en entornos nocturnos. Estos estudios exploran métodos como el uso de imágenes infrarrojas para mejorar la visibilidad de las imágenes nocturnas o la conversión de imágenes nocturnas en representaciones similares a las diurnas para una mayor visibilidad. Esta investigación presenta una técnica centrada en convertir las condiciones de la carretera representadas en imágenes nocturnas para que se asemejen a escenas diurnas. Para facilitar esto, se crea un conjunto de datos emparejados mediante la ampliación de datos limitados de imágenes diurnas y nocturnas utilizando CycleGAN. El modelo se entrena utilizando tanto imágenes originales nocturnas como imágenes diurnas de transformación de luminancia de una sola escala (SLAT) para mejorar el nivel de detalle en las imágenes diurnas convertidas. Sin embargo, las imágenes diurnas generadas pueden presentar problemas de nitidez y ruido. Para abordar estas preocupaciones, se emplea un enfoque de procesamiento de imágenes, inspirado en el efecto Stevens y el desenfoque local, que se alinean con las características visuales para reducir el ruido y mejorar los detalles de la imagen. En consecuencia, este estudio contribuye a mejorar la visibilidad de las imágenes nocturnas mediante la conversión de imágenes diurnas y el posterior procesamiento de imágenes. La propuesta de traducción de imágenes de noche a día en este estudio tiene un tiempo de procesamiento de 0,81 s, incluido el procesamiento de imágenes, que es inferior a un segundo. Por lo tanto, se considera valioso como módulo para la traducción de imágenes diurnas. Además, la métrica de evaluación de calidad de imagen, BRISQUE, arrojó una puntuación de 19.8, lo que indica un mejor rendimiento en comparación con los métodos convencionales. Los resultados de esta investigación tienen aplicaciones potenciales en campos como los sistemas de vigilancia CCTV y los automóviles autónomos.
Descripción
Numerosos estudios están en marcha para mejorar la identificación de los alrededores en entornos nocturnos. Estos estudios exploran métodos como el uso de imágenes infrarrojas para mejorar la visibilidad de las imágenes nocturnas o la conversión de imágenes nocturnas en representaciones similares a las diurnas para una mayor visibilidad. Esta investigación presenta una técnica centrada en convertir las condiciones de la carretera representadas en imágenes nocturnas para que se asemejen a escenas diurnas. Para facilitar esto, se crea un conjunto de datos emparejados mediante la ampliación de datos limitados de imágenes diurnas y nocturnas utilizando CycleGAN. El modelo se entrena utilizando tanto imágenes originales nocturnas como imágenes diurnas de transformación de luminancia de una sola escala (SLAT) para mejorar el nivel de detalle en las imágenes diurnas convertidas. Sin embargo, las imágenes diurnas generadas pueden presentar problemas de nitidez y ruido. Para abordar estas preocupaciones, se emplea un enfoque de procesamiento de imágenes, inspirado en el efecto Stevens y el desenfoque local, que se alinean con las características visuales para reducir el ruido y mejorar los detalles de la imagen. En consecuencia, este estudio contribuye a mejorar la visibilidad de las imágenes nocturnas mediante la conversión de imágenes diurnas y el posterior procesamiento de imágenes. La propuesta de traducción de imágenes de noche a día en este estudio tiene un tiempo de procesamiento de 0,81 s, incluido el procesamiento de imágenes, que es inferior a un segundo. Por lo tanto, se considera valioso como módulo para la traducción de imágenes diurnas. Además, la métrica de evaluación de calidad de imagen, BRISQUE, arrojó una puntuación de 19.8, lo que indica un mejor rendimiento en comparación con los métodos convencionales. Los resultados de esta investigación tienen aplicaciones potenciales en campos como los sistemas de vigilancia CCTV y los automóviles autónomos.