logo móvil
Contáctanos

Identificación facial utilizando aumento de datos basado en la combinación de DCGANs y manipulaciones básicas

Autores: Ammar, Sirine; Bouwmans, Thierry; Neji, Mahmoud

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Identificación facial utilizando aumento de datos basado en la combinación de DCGANs y manipulaciones básicas


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Redes neuronales profundas
Visión por computadora
Clasificación de imágenes
Reconocimiento facial
Algoritmos de aprendizaje profundo
Métodos generativos

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Recientemente, las Redes Neuronales Profundas (DNNs) se han convertido en un tema central de discusión en la visión por computadora para una amplia gama de aplicaciones, incluyendo la clasificación de imágenes y el reconocimiento facial. En comparación con los métodos convencionales de aprendizaje automático existentes, los algoritmos de aprendizaje profundo han mostrado un rendimiento destacado con alta precisión y velocidad. Sin embargo, siempre requieren una gran cantidad de datos para lograr una robustez adecuada. Además, la recolección de muestras adicionales es costosa y consume mucho tiempo. En este artículo, proponemos un enfoque que combina métodos generativos y manipulaciones básicas para aumentaciones de datos de imagen y el modelo FaceNet con Máquina de Vectores de Soporte (SVM) para el reconocimiento facial. Para ello, las imágenes fueron primero preprocesadas por una Red Generativa Antagónica de Convolución Profunda (DCGAN) para generar muestras con propiedades realistas inseparables de las de los conjuntos de datos originales. En segundo lugar, se aplicaron manipulaciones básicas a las imágenes producidas por DCGAN con el fin de aumentar la cantidad de datos de entrenamiento. Finalmente, se empleó FaceNet como modelo de reconocimiento facial. FaceNet detecta rostros utilizando MTCNN, se calcula un embebido facial de 128 dimensiones para cuantificar cada rostro, y se utilizó un SVM sobre los embebidos para la clasificación. Los experimentos realizados en las bases de datos de imágenes LFW y VGG y en la base de datos de video ChokePoint demuestran que la combinación de métodos básicos y generativos para la aumentación mejoró el rendimiento del reconocimiento facial, llevando a mejores resultados de reconocimiento.

Otros recursos que podrían interesarte

Temas Virtualpro