Identificación facial utilizando aumento de datos basado en la combinación de DCGANs y manipulaciones básicas

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Identificación facial utilizando aumento de datos basado en la combinación de DCGANs y manipulaciones básicas

Autores: Ammar, Sirine; Bouwmans, Thierry; Neji, Mahmoud

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico

2022

Identificación facial utilizando aumento de datos basado en la combinación de DCGANs y manipulaciones básicas

Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Redes neuronales profundas

Visión por computadora

Clasificación de imágenes

Reconocimiento facial

Algoritmos de aprendizaje profundo

Métodos generativos

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

Recientemente, las Redes Neuronales Profundas (DNNs) se han convertido en un tema central de discusión en la visión por computadora para una amplia gama de aplicaciones, incluyendo la clasificación de imágenes y el reconocimiento facial. En comparación con los métodos convencionales de aprendizaje automático existentes, los algoritmos de aprendizaje profundo han mostrado un rendimiento destacado con alta precisión y velocidad. Sin embargo, siempre requieren una gran cantidad de datos para lograr una robustez adecuada. Además, la recolección de muestras adicionales es costosa y consume mucho tiempo. En este artículo, proponemos un enfoque que combina métodos generativos y manipulaciones básicas para aumentaciones de datos de imagen y el modelo FaceNet con Máquina de Vectores de Soporte (SVM) para el reconocimiento facial. Para ello, las imágenes fueron primero preprocesadas por una Red Generativa Antagónica de Convolución Profunda (DCGAN) para generar muestras con propiedades realistas inseparables de las de los conjuntos de datos originales. En segundo lugar, se aplicaron manipulaciones básicas a las imágenes producidas por DCGAN con el fin de aumentar la cantidad de datos de entrenamiento. Finalmente, se empleó FaceNet como modelo de reconocimiento facial. FaceNet detecta rostros utilizando MTCNN, se calcula un embebido facial de 128 dimensiones para cuantificar cada rostro, y se utilizó un SVM sobre los embebidos para la clasificación. Los experimentos realizados en las bases de datos de imágenes LFW y VGG y en la base de datos de video ChokePoint demuestran que la combinación de métodos básicos y generativos para la aumentación mejoró el rendimiento del reconocimiento facial, llevando a mejores resultados de reconocimiento.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro