Upsampling en tiempo real, videos de CCTV de baja resolución utilizando Redes Generativas Adversarias
Autores: Hazra, Debapriya; Byun, Yung-Cheol
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Upsampling en tiempo real, videos de CCTV de baja resolución utilizando Redes Generativas Adversarias
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Videos de baja resolución
Red generativa adversaria
Videos de CCTV
Generadores espacio-temporales
Conjuntos de datos de referencia
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
La superresolución de video se ha convertido en un tema emergente en el campo del aprendizaje automático. La red generativa adversaria es un marco ampliamente utilizado para desarrollar soluciones para videos de baja resolución. La vigilancia de video mediante circuito cerrado de televisión (CCTV) es significativa en todos los campos, en todo el mundo. Un problema común con los videos de CCTV es la pérdida repentina de video o la mala calidad. En este documento, proponemos una red generativa adversaria que implementa generadores y discriminadores espacio-temporales para mejorar videos de CCTV de baja resolución en tiempo real a alta resolución. El modelo propuesto considera tanto el movimiento del primer plano como del fondo de un video de CCTV y modela de manera efectiva la consistencia espacial y temporal desde fotogramas de video de baja resolución para generar videos de alta resolución. Experimentos cuantitativos y cualitativos en conjuntos de datos de referencia, incluidos Kinetics-700, UCF101, HMDB51 e IITH_Helmet2, mostraron que nuestro modelo supera a los modelos de GAN existentes para la superresolución de video.
Descripción
La superresolución de video se ha convertido en un tema emergente en el campo del aprendizaje automático. La red generativa adversaria es un marco ampliamente utilizado para desarrollar soluciones para videos de baja resolución. La vigilancia de video mediante circuito cerrado de televisión (CCTV) es significativa en todos los campos, en todo el mundo. Un problema común con los videos de CCTV es la pérdida repentina de video o la mala calidad. En este documento, proponemos una red generativa adversaria que implementa generadores y discriminadores espacio-temporales para mejorar videos de CCTV de baja resolución en tiempo real a alta resolución. El modelo propuesto considera tanto el movimiento del primer plano como del fondo de un video de CCTV y modela de manera efectiva la consistencia espacial y temporal desde fotogramas de video de baja resolución para generar videos de alta resolución. Experimentos cuantitativos y cualitativos en conjuntos de datos de referencia, incluidos Kinetics-700, UCF101, HMDB51 e IITH_Helmet2, mostraron que nuestro modelo supera a los modelos de GAN existentes para la superresolución de video.