Combinando Clasificadores para el Reconocimiento Facial con Máscara mediante Aprendizaje Profundo
Autores: Cheng, Wen-Chang; Hsiao, Hung-Chou; Huang, Yung-Fa; Li, Li-Hua
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Combinando Clasificadores para el Reconocimiento Facial con Máscara mediante Aprendizaje Profundo
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Arquitectura de modelo de red
Reconocimiento facial con máscara
Método de entrenamiento FaceNet
Redes neuronales convolucionales
Pérdida de tripleta
Pérdida de entropía cruzada categórica
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Esta investigación propone una arquitectura de modelo de red única para el reconocimiento de rostros con máscara utilizando el método de entrenamiento FaceNet. Se combinan tres redes neuronales convolucionales preentrenadas de diferentes tamaños, a saber, InceptionResNetV2, InceptionV3 y MobileNetV2. Los modelos se amplían conectando una red completamente conectada con una capa de salida SoftMax. Combinamos la pérdida de tripletas y la pérdida de entropía cruzada categórica para optimizar el proceso de entrenamiento. Además, la tasa de aprendizaje del optimizador se actualiza dinámicamente utilizando el mecanismo de enfriamiento coseno, lo que mejora la convergencia del modelo durante el entrenamiento. Los resultados experimentales del reconocimiento de rostros con máscara (MFR) en un conjunto de datos personalizado MASK600 muestran que los InceptionResNetV2 y InceptionV3 propuestos utilizan solo 20 épocas de entrenamiento, y MobileNetV2 utiliza solo 50 épocas de entrenamiento, pero logran más del 93% de precisión en comparación con los trabajos anteriores de MFR con enfriamiento. Además de alcanzar un nivel práctico, ahorra tiempo en el entrenamiento de modelos y reduce efectivamente los costos de energía.
Descripción
Esta investigación propone una arquitectura de modelo de red única para el reconocimiento de rostros con máscara utilizando el método de entrenamiento FaceNet. Se combinan tres redes neuronales convolucionales preentrenadas de diferentes tamaños, a saber, InceptionResNetV2, InceptionV3 y MobileNetV2. Los modelos se amplían conectando una red completamente conectada con una capa de salida SoftMax. Combinamos la pérdida de tripletas y la pérdida de entropía cruzada categórica para optimizar el proceso de entrenamiento. Además, la tasa de aprendizaje del optimizador se actualiza dinámicamente utilizando el mecanismo de enfriamiento coseno, lo que mejora la convergencia del modelo durante el entrenamiento. Los resultados experimentales del reconocimiento de rostros con máscara (MFR) en un conjunto de datos personalizado MASK600 muestran que los InceptionResNetV2 y InceptionV3 propuestos utilizan solo 20 épocas de entrenamiento, y MobileNetV2 utiliza solo 50 épocas de entrenamiento, pero logran más del 93% de precisión en comparación con los trabajos anteriores de MFR con enfriamiento. Además de alcanzar un nivel práctico, ahorra tiempo en el entrenamiento de modelos y reduce efectivamente los costos de energía.