Un modelo ligero que mejora el reconocimiento de expresiones faciales con sesgo espacial y pérdida de armonía de coseno
Autores: Chen, Xuefeng; Huang, Liangyu
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un modelo ligero que mejora el reconocimiento de expresiones faciales con sesgo espacial y pérdida de armonía de coseno
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Red de reconocimiento de expresiones faciales
Red facial ligera con sesgo espacial
Red de extracción de características
Módulo de sesgo espacial
Pérdida de armonía de coseno
Precisión de reconocimiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 41
Citaciones: Sin citaciones
Este documento propone una red de reconocimiento de expresiones faciales llamada Red Facial Ligera con Sesgo Espacial (LFNSB). El modelo LFNSB equilibra de manera efectiva la complejidad del modelo y la precisión del reconocimiento. Tiene dos componentes clave: una red de extracción de características ligera (LFN) y un módulo de Sesgo Espacial (SB) para la agregación de información global. El LFN introduce operaciones de canal combinadas y técnicas de convolución de profundidad, reduciendo efectivamente el número de parámetros mientras mejora la capacidad de representación de características. El módulo de Sesgo Espacial permite que el modelo se centre en características faciales locales mientras captura las dependencias entre diferentes regiones faciales. Además, se diseña una nueva función de pérdida llamada Pérdida de Armonía Coseno. Esta función optimiza las posiciones relativas de los vectores de características en el espacio de alta dimensión, lo que resulta en una mejor separación y agrupación de características. Los resultados experimentales en los conjuntos de datos AffectNet y RAF-DB demuestran que el modelo LFNSB logra una precisión de reconocimiento competitiva, con un 63.12% de precisión en AffectNet-8, un 66.57% de precisión en AffectNet-7 y un 91.07% de precisión en RAF-DB, al tiempo que reduce significativamente la complejidad del modelo.
Descripción
Este documento propone una red de reconocimiento de expresiones faciales llamada Red Facial Ligera con Sesgo Espacial (LFNSB). El modelo LFNSB equilibra de manera efectiva la complejidad del modelo y la precisión del reconocimiento. Tiene dos componentes clave: una red de extracción de características ligera (LFN) y un módulo de Sesgo Espacial (SB) para la agregación de información global. El LFN introduce operaciones de canal combinadas y técnicas de convolución de profundidad, reduciendo efectivamente el número de parámetros mientras mejora la capacidad de representación de características. El módulo de Sesgo Espacial permite que el modelo se centre en características faciales locales mientras captura las dependencias entre diferentes regiones faciales. Además, se diseña una nueva función de pérdida llamada Pérdida de Armonía Coseno. Esta función optimiza las posiciones relativas de los vectores de características en el espacio de alta dimensión, lo que resulta en una mejor separación y agrupación de características. Los resultados experimentales en los conjuntos de datos AffectNet y RAF-DB demuestran que el modelo LFNSB logra una precisión de reconocimiento competitiva, con un 63.12% de precisión en AffectNet-8, un 66.57% de precisión en AffectNet-7 y un 91.07% de precisión en RAF-DB, al tiempo que reduce significativamente la complejidad del modelo.