Un red de características mixtas de atención de doble dirección para el reconocimiento de expresiones faciales
Autores: Zhang, Saining; Zhang, Yuhang; Zhang, Ye; Wang, Yufei; Song, Zhigang
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un red de características mixtas de atención de doble dirección para el reconocimiento de expresiones faciales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Reconocimiento de expresiones faciales
Red de Características Mixtas de Atención de Doble Dirección
Investigación en visión por computadora
Arquitectura de red
Mapas de atención
Mecanismo de pérdida de atención
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
En los últimos años, el reconocimiento de expresiones faciales (FER) ha captado una atención significativa dentro del ámbito de la investigación en visión por computadora. Este artículo presenta una red innovadora llamada Red de Características Mixtas de Atención de Doble Dirección (DDAMFN) diseñada específicamente para FER, que presume tanto robustez como características ligeras. La arquitectura de la red consta de dos componentes principales: la Red de Características Mixtas (MFN) que sirve como la columna vertebral, y la Red de Atención de Doble Dirección (DDAN) que funciona como la cabeza. Para mejorar la capacidad de la red en el MFN, se extraen características resistentes utilizando núcleos de tamaño mixto. Además, se propone una nueva cabeza de Atención de Doble Dirección (DDA) que genera mapas de atención en dos orientaciones, lo que permite al modelo capturar dependencias a larga distancia de manera efectiva. Para mejorar aún más la precisión, se introduce un mecanismo de pérdida de atención novedoso para el DDAN con diferentes cabezas enfocándose en áreas distintas de la entrada. Las evaluaciones experimentales en varios conjuntos de datos públicos ampliamente utilizados, incluidos AffectNet, RAF-DB y FERPlus, demuestran la superioridad del DDAMFN en comparación con otros modelos existentes, lo que establece al DDAMFN como el modelo de vanguardia en el campo de FER.
Descripción
En los últimos años, el reconocimiento de expresiones faciales (FER) ha captado una atención significativa dentro del ámbito de la investigación en visión por computadora. Este artículo presenta una red innovadora llamada Red de Características Mixtas de Atención de Doble Dirección (DDAMFN) diseñada específicamente para FER, que presume tanto robustez como características ligeras. La arquitectura de la red consta de dos componentes principales: la Red de Características Mixtas (MFN) que sirve como la columna vertebral, y la Red de Atención de Doble Dirección (DDAN) que funciona como la cabeza. Para mejorar la capacidad de la red en el MFN, se extraen características resistentes utilizando núcleos de tamaño mixto. Además, se propone una nueva cabeza de Atención de Doble Dirección (DDA) que genera mapas de atención en dos orientaciones, lo que permite al modelo capturar dependencias a larga distancia de manera efectiva. Para mejorar aún más la precisión, se introduce un mecanismo de pérdida de atención novedoso para el DDAN con diferentes cabezas enfocándose en áreas distintas de la entrada. Las evaluaciones experimentales en varios conjuntos de datos públicos ampliamente utilizados, incluidos AffectNet, RAF-DB y FERPlus, demuestran la superioridad del DDAMFN en comparación con otros modelos existentes, lo que establece al DDAMFN como el modelo de vanguardia en el campo de FER.