La reconocimiento humano multimodal en un entorno de iluminación significativamente bajo utilizando EnlightenGAN modificado
Autores: Koo, Ja Hyung; Cho, Se Woon; Baek, Na Rae; Park, Kang Ryoung
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
La reconocimiento humano multimodal en un entorno de iluminación significativamente bajo utilizando EnlightenGAN modificado
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Reconocimiento humano
Entornos interiores
Iluminación baja
EnlightenGAN
Red neuronal convolucional
Bases de datos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
El reconocimiento humano en entornos interiores ocurre tanto de día como de noche. Durante el día, el reconocimiento humano se encuentra con degradación del rendimiento debido a un desenfoque generado cuando una cámara captura la imagen de una persona. Sin embargo, cuando las imágenes se capturan por la noche con una cámara, es difícil obtener imágenes perfectas de una persona sin luz, y las imágenes de entrada son muy ruidosas debido a las propiedades de los sensores de cámara en entornos de baja iluminación. Se han realizado estudios en el pasado sobre el reconocimiento facial en entornos de baja iluminación; sin embargo, existe una falta de investigación sobre el reconocimiento humano basado en rostro y cuerpo en entornos de muy baja iluminación. Para resolver estos problemas, este estudio propone una red generativa adversarial iluminada modificada (modified EnlightenGAN) en la que una imagen de muy baja iluminación se convierte en una imagen de iluminación normal, y los puntajes de coincidencia de las características de red neuronal convolucional profunda (CNN) del rostro y cuerpo en la imagen convertida se combinan con una fusión a nivel de puntaje para el reconocimiento. Los dos tipos de bases de datos utilizadas en este estudio son la base de datos de rostro y cuerpo de Dongguk versión 3 (DFB-DB3) y el conjunto de datos abierto de ChokePoint. Los resultados del experimento realizado utilizando las dos bases de datos muestran que la precisión de verificación humana (tasa de error igual (ERR)) y la precisión de identificación (tasa de aceptación genuina de rango 1 (GAR)) del método propuesto fueron del 7,291% y 92,67% para DFB-DB3 y del 10,59% y 87,78% para el conjunto de datos de ChokePoint, respectivamente. Por lo tanto, el rendimiento del método propuesto fue mejor que los métodos anteriores.
Descripción
El reconocimiento humano en entornos interiores ocurre tanto de día como de noche. Durante el día, el reconocimiento humano se encuentra con degradación del rendimiento debido a un desenfoque generado cuando una cámara captura la imagen de una persona. Sin embargo, cuando las imágenes se capturan por la noche con una cámara, es difícil obtener imágenes perfectas de una persona sin luz, y las imágenes de entrada son muy ruidosas debido a las propiedades de los sensores de cámara en entornos de baja iluminación. Se han realizado estudios en el pasado sobre el reconocimiento facial en entornos de baja iluminación; sin embargo, existe una falta de investigación sobre el reconocimiento humano basado en rostro y cuerpo en entornos de muy baja iluminación. Para resolver estos problemas, este estudio propone una red generativa adversarial iluminada modificada (modified EnlightenGAN) en la que una imagen de muy baja iluminación se convierte en una imagen de iluminación normal, y los puntajes de coincidencia de las características de red neuronal convolucional profunda (CNN) del rostro y cuerpo en la imagen convertida se combinan con una fusión a nivel de puntaje para el reconocimiento. Los dos tipos de bases de datos utilizadas en este estudio son la base de datos de rostro y cuerpo de Dongguk versión 3 (DFB-DB3) y el conjunto de datos abierto de ChokePoint. Los resultados del experimento realizado utilizando las dos bases de datos muestran que la precisión de verificación humana (tasa de error igual (ERR)) y la precisión de identificación (tasa de aceptación genuina de rango 1 (GAR)) del método propuesto fueron del 7,291% y 92,67% para DFB-DB3 y del 10,59% y 87,78% para el conjunto de datos de ChokePoint, respectivamente. Por lo tanto, el rendimiento del método propuesto fue mejor que los métodos anteriores.