Identificación facial utilizando aumento de datos basado en la combinación de DCGANs y manipulaciones básicas
Autores: Ammar, Sirine; Bouwmans, Thierry; Neji, Mahmoud
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Identificación facial utilizando aumento de datos basado en la combinación de DCGANs y manipulaciones básicas
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Redes neuronales profundas
Visión por computadora
Clasificación de imágenes
Reconocimiento facial
Algoritmos de aprendizaje profundo
Métodos generativos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Recientemente, las Redes Neuronales Profundas (DNNs) se han convertido en un tema central de discusión en la visión por computadora para una amplia gama de aplicaciones, incluyendo la clasificación de imágenes y el reconocimiento facial. En comparación con los métodos convencionales de aprendizaje automático existentes, los algoritmos de aprendizaje profundo han mostrado un rendimiento destacado con alta precisión y velocidad. Sin embargo, siempre requieren una gran cantidad de datos para lograr una robustez adecuada. Además, la recolección de muestras adicionales es costosa y consume mucho tiempo. En este artículo, proponemos un enfoque que combina métodos generativos y manipulaciones básicas para aumentaciones de datos de imagen y el modelo FaceNet con Máquina de Vectores de Soporte (SVM) para el reconocimiento facial. Para ello, las imágenes fueron primero preprocesadas por una Red Generativa Antagónica de Convolución Profunda (DCGAN) para generar muestras con propiedades realistas inseparables de las de los conjuntos de datos originales. En segundo lugar, se aplicaron manipulaciones básicas a las imágenes producidas por DCGAN con el fin de aumentar la cantidad de datos de entrenamiento. Finalmente, se empleó FaceNet como modelo de reconocimiento facial. FaceNet detecta rostros utilizando MTCNN, se calcula un embebido facial de 128 dimensiones para cuantificar cada rostro, y se utilizó un SVM sobre los embebidos para la clasificación. Los experimentos realizados en las bases de datos de imágenes LFW y VGG y en la base de datos de video ChokePoint demuestran que la combinación de métodos básicos y generativos para la aumentación mejoró el rendimiento del reconocimiento facial, llevando a mejores resultados de reconocimiento.
Descripción
Recientemente, las Redes Neuronales Profundas (DNNs) se han convertido en un tema central de discusión en la visión por computadora para una amplia gama de aplicaciones, incluyendo la clasificación de imágenes y el reconocimiento facial. En comparación con los métodos convencionales de aprendizaje automático existentes, los algoritmos de aprendizaje profundo han mostrado un rendimiento destacado con alta precisión y velocidad. Sin embargo, siempre requieren una gran cantidad de datos para lograr una robustez adecuada. Además, la recolección de muestras adicionales es costosa y consume mucho tiempo. En este artículo, proponemos un enfoque que combina métodos generativos y manipulaciones básicas para aumentaciones de datos de imagen y el modelo FaceNet con Máquina de Vectores de Soporte (SVM) para el reconocimiento facial. Para ello, las imágenes fueron primero preprocesadas por una Red Generativa Antagónica de Convolución Profunda (DCGAN) para generar muestras con propiedades realistas inseparables de las de los conjuntos de datos originales. En segundo lugar, se aplicaron manipulaciones básicas a las imágenes producidas por DCGAN con el fin de aumentar la cantidad de datos de entrenamiento. Finalmente, se empleó FaceNet como modelo de reconocimiento facial. FaceNet detecta rostros utilizando MTCNN, se calcula un embebido facial de 128 dimensiones para cuantificar cada rostro, y se utilizó un SVM sobre los embebidos para la clasificación. Los experimentos realizados en las bases de datos de imágenes LFW y VGG y en la base de datos de video ChokePoint demuestran que la combinación de métodos básicos y generativos para la aumentación mejoró el rendimiento del reconocimiento facial, llevando a mejores resultados de reconocimiento.