Ufacenet: investigación sobre algoritmo de reconocimiento facial multitarea basado en CNN
Autores: Li, Huoyou; Hu, Jianshiun; Yu, Jingwen; Yu, Ning; Wu, Qingqiang
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Ufacenet: investigación sobre algoritmo de reconocimiento facial multitarea basado en CNN
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Redes neuronales convolucionales profundas
Tareas de visión por computadora
Algoritmo de reconocimiento facial
Red neuronal
Detección de puntos clave
UFaceNet
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
Con la aplicación de redes neuronales convolucionales profundas, el rendimiento de las tareas de visión por computadora ha mejorado a un nuevo nivel. La construcción de una red más profunda y compleja permite que el algoritmo de reconocimiento facial obtenga una mayor precisión. Sin embargo, las desventajas de los altos costos de computación y almacenamiento de las redes neuronales limitan la mayor popularización del algoritmo. Para resolver este problema, hemos estudiado el algoritmo de reconocimiento facial de red neuronal unificado y eficiente bajo la condición de una sola cámara; proponemos que el proceso completo de reconocimiento facial consta de cuatro tareas: detección facial, detección in vivo, detección de puntos clave y verificación facial; combinando los algoritmos clave de estas cuatro tareas, proponemos un modelo de red unificada basado en una estructura convolucional profunda separable: UFaceNet. El modelo utiliza datos de múltiples fuentes para llevar a cabo un entrenamiento conjunto de múltiples tareas y utiliza los resultados de detección de puntos clave para ayudar al aprendizaje de otras tareas. Introduce además el mecanismo de atención a través de recorte y alineación a nivel de características para garantizar la precisión del modelo, utilizando la red de capas convolucionales compartidas entre tareas para reducir la cantidad de cálculos del modelo y lograr una aceleración de la red. El objetivo de aprendizaje de múltiples tareas aumenta implícitamente la cantidad de datos de entrenamiento y la distribución de datos diferentes, lo que facilita el aprendizaje de las características con generalización. Los resultados experimentales muestran que el modelo UFaceNet es mejor que otros modelos en términos de cantidad de cálculos y número de parámetros con una mayor eficiencia, y algunas áreas potenciales para ser utilizadas.
Descripción
Con la aplicación de redes neuronales convolucionales profundas, el rendimiento de las tareas de visión por computadora ha mejorado a un nuevo nivel. La construcción de una red más profunda y compleja permite que el algoritmo de reconocimiento facial obtenga una mayor precisión. Sin embargo, las desventajas de los altos costos de computación y almacenamiento de las redes neuronales limitan la mayor popularización del algoritmo. Para resolver este problema, hemos estudiado el algoritmo de reconocimiento facial de red neuronal unificado y eficiente bajo la condición de una sola cámara; proponemos que el proceso completo de reconocimiento facial consta de cuatro tareas: detección facial, detección in vivo, detección de puntos clave y verificación facial; combinando los algoritmos clave de estas cuatro tareas, proponemos un modelo de red unificada basado en una estructura convolucional profunda separable: UFaceNet. El modelo utiliza datos de múltiples fuentes para llevar a cabo un entrenamiento conjunto de múltiples tareas y utiliza los resultados de detección de puntos clave para ayudar al aprendizaje de otras tareas. Introduce además el mecanismo de atención a través de recorte y alineación a nivel de características para garantizar la precisión del modelo, utilizando la red de capas convolucionales compartidas entre tareas para reducir la cantidad de cálculos del modelo y lograr una aceleración de la red. El objetivo de aprendizaje de múltiples tareas aumenta implícitamente la cantidad de datos de entrenamiento y la distribución de datos diferentes, lo que facilita el aprendizaje de las características con generalización. Los resultados experimentales muestran que el modelo UFaceNet es mejor que otros modelos en términos de cantidad de cálculos y número de parámetros con una mayor eficiencia, y algunas áreas potenciales para ser utilizadas.