Eficiente localización de puntos de referencia faciales basada en redes neuronales binarizadas
Autores: Chen, Hanlin; Zhang, Xudong; Ma, Teli; Yue, Haosong; Wang, Xin; Zhang, Baochang
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Eficiente localización de puntos de referencia faciales basada en redes neuronales binarizadas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Localización de puntos de referencia faciales
Redes neuronales convolucionales profundas
CNN binarizadas
Redes convolucionales de amplitud
Eficiencia de almacenamiento
Mejora de rendimiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
La localización de puntos de referencia faciales es una tarea significativa pero desafiante en visión por computadora, cuya precisión ha mejorado notablemente debido a la exitosa aplicación de Redes Neuronales Convolucionales profundas (CNNs). Sin embargo, las CNNs requieren un gran almacenamiento y sobrecarga computacional, lo que dificulta su implementación en plataformas con limitaciones computacionales. En este documento, hasta donde sabemos, es la primera vez que se implementa una localización eficiente de puntos de referencia faciales a través de CNNs binarizadas. Introducimos una nueva arquitectura de red para calcular los modelos binarizados, denominada Redes Convolucionales de Amplitud (ACNs), basada en el algoritmo de retropropagación asincrónica propuesto. Podemos recuperar eficientemente los filtros de precisión completa utilizando solo un factor de manera integral, y la eficiencia de las CNNs para la localización de puntos de referencia faciales se mejora aún más mediante las ACNs de 1 bit extremadamente comprimidas. Nuestras ACNs reducen el espacio de almacenamiento de los filtros convolucionales en un factor de 32 en comparación con los modelos de precisión completa en los conjuntos de datos LFW+Webface, CelebA, BioID y 300W, al tiempo que logran un rendimiento comparable a los algoritmos de localización de puntos de referencia faciales de precisión completa.
Descripción
La localización de puntos de referencia faciales es una tarea significativa pero desafiante en visión por computadora, cuya precisión ha mejorado notablemente debido a la exitosa aplicación de Redes Neuronales Convolucionales profundas (CNNs). Sin embargo, las CNNs requieren un gran almacenamiento y sobrecarga computacional, lo que dificulta su implementación en plataformas con limitaciones computacionales. En este documento, hasta donde sabemos, es la primera vez que se implementa una localización eficiente de puntos de referencia faciales a través de CNNs binarizadas. Introducimos una nueva arquitectura de red para calcular los modelos binarizados, denominada Redes Convolucionales de Amplitud (ACNs), basada en el algoritmo de retropropagación asincrónica propuesto. Podemos recuperar eficientemente los filtros de precisión completa utilizando solo un factor de manera integral, y la eficiencia de las CNNs para la localización de puntos de referencia faciales se mejora aún más mediante las ACNs de 1 bit extremadamente comprimidas. Nuestras ACNs reducen el espacio de almacenamiento de los filtros convolucionales en un factor de 32 en comparación con los modelos de precisión completa en los conjuntos de datos LFW+Webface, CelebA, BioID y 300W, al tiempo que logran un rendimiento comparable a los algoritmos de localización de puntos de referencia faciales de precisión completa.