Reconocimiento Facial Basado en Redes Neuronales Convolucionales Livianas
Autores: Liu, Wenting; Zhou, Li; Chen, Jie
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Reconocimiento Facial Basado en Redes Neuronales Convolucionales Livianas
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Algoritmos de reconocimiento facial
Métodos de aprendizaje profundo
Redes neuronales convolucionales
MobileFaceNet
Bloque de Squeeze-and-Excitation
Función de pérdida de margen angular aditivo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los algoritmos de reconocimiento facial basados en métodos de aprendizaje profundo se han vuelto cada vez más populares. La mayoría de estos se basan en redes neuronales convolucionales (CNN) altamente precisas pero complejas, que requieren recursos computacionales y almacenamiento significativos, y son difíciles de implementar en dispositivos móviles o terminales embebidos. En este documento, proponemos varios métodos para mejorar los algoritmos de reconocimiento facial basados en una CNN ligera, que se optimiza aún más en términos de la arquitectura de la red y el patrón de entrenamiento sobre la base de MobileFaceNet. En cuanto a la arquitectura de la red, introducimos el bloque Squeeze-and-Excitation (SE) y proponemos tres estructuras mejoradas a través de un mecanismo de atención de canal: el módulo SE de profundidad, el módulo SE separable por profundidad y el módulo SE lineal, que son capaces de aprender la correlación de información entre canales y asignarles diferentes pesos. Además, se propone un nuevo método de entrenamiento para la tarea de reconocimiento facial combinado con una función de pérdida de margen angular aditivo que realiza la compresión y transferencia de conocimiento de la red profunda para el reconocimiento facial. Finalmente, obtuvimos modelos de reconocimiento facial de alta precisión y ligeros con menos parámetros y cálculos que son más adecuados para aplicaciones. A través de extensos experimentos y análisis, demostramos la efectividad de los métodos propuestos.
Descripción
Los algoritmos de reconocimiento facial basados en métodos de aprendizaje profundo se han vuelto cada vez más populares. La mayoría de estos se basan en redes neuronales convolucionales (CNN) altamente precisas pero complejas, que requieren recursos computacionales y almacenamiento significativos, y son difíciles de implementar en dispositivos móviles o terminales embebidos. En este documento, proponemos varios métodos para mejorar los algoritmos de reconocimiento facial basados en una CNN ligera, que se optimiza aún más en términos de la arquitectura de la red y el patrón de entrenamiento sobre la base de MobileFaceNet. En cuanto a la arquitectura de la red, introducimos el bloque Squeeze-and-Excitation (SE) y proponemos tres estructuras mejoradas a través de un mecanismo de atención de canal: el módulo SE de profundidad, el módulo SE separable por profundidad y el módulo SE lineal, que son capaces de aprender la correlación de información entre canales y asignarles diferentes pesos. Además, se propone un nuevo método de entrenamiento para la tarea de reconocimiento facial combinado con una función de pérdida de margen angular aditivo que realiza la compresión y transferencia de conocimiento de la red profunda para el reconocimiento facial. Finalmente, obtuvimos modelos de reconocimiento facial de alta precisión y ligeros con menos parámetros y cálculos que son más adecuados para aplicaciones. A través de extensos experimentos y análisis, demostramos la efectividad de los métodos propuestos.