Investigación sobre el algoritmo de reconocimiento de expresiones faciales basado en transformador ligero
Autores: Jiang, Bin; Li, Nanxing; Cui, Xiaomei; Liu, Weihua; Yu, Zeqi; Xie, Yongheng
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Investigación sobre el algoritmo de reconocimiento de expresiones faciales basado en transformador ligero
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Sobreajuste
Reconocimiento de expresiones faciales
MobileViT
Operaciones de convolución profunda
Función de activación
Reducción de dimensiones
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Para evitar el problema de sobreajuste del modelo de red y mejorar el efecto de reconocimiento de expresiones faciales de imágenes faciales parcialmente ocluidas, se ha propuesto un algoritmo de reconocimiento de expresiones faciales mejorado basado en MobileViT. En primer lugar, para obtener características que sean útiles y más ricas para los experimentos, se añaden operaciones de convolución profunda a los bloques residuales invertidos de esta red, mejorando así la tasa de reconocimiento de expresiones faciales. Luego, en el proceso de reducción de dimensiones, la función de activación puede mejorar significativamente la velocidad de convergencia del modelo, y luego reducir rápidamente el error de pérdida en el proceso de entrenamiento, así como preservar las características efectivas de las expresiones faciales tanto como sea posible y reducir el problema de sobreajuste. Los resultados experimentales en RaFD, FER2013 y FER2013Plus muestran que este método tiene ventajas significativas sobre las redes convencionales y la red alcanza la tasa de reconocimiento más alta.
Descripción
Para evitar el problema de sobreajuste del modelo de red y mejorar el efecto de reconocimiento de expresiones faciales de imágenes faciales parcialmente ocluidas, se ha propuesto un algoritmo de reconocimiento de expresiones faciales mejorado basado en MobileViT. En primer lugar, para obtener características que sean útiles y más ricas para los experimentos, se añaden operaciones de convolución profunda a los bloques residuales invertidos de esta red, mejorando así la tasa de reconocimiento de expresiones faciales. Luego, en el proceso de reducción de dimensiones, la función de activación puede mejorar significativamente la velocidad de convergencia del modelo, y luego reducir rápidamente el error de pérdida en el proceso de entrenamiento, así como preservar las características efectivas de las expresiones faciales tanto como sea posible y reducir el problema de sobreajuste. Los resultados experimentales en RaFD, FER2013 y FER2013Plus muestran que este método tiene ventajas significativas sobre las redes convencionales y la red alcanza la tasa de reconocimiento más alta.