Red de Compartición de Diversidad de Afinidad de Atención Multi-Cabeza para el Reconocimiento de Expresiones Faciales
Autores: Zheng, Caixia; Liu, Jiayu; Zhao, Wei; Ge, Yingying; Chen, Wenhe
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Red de Compartición de Diversidad de Afinidad de Atención Multi-Cabeza para el Reconocimiento de Expresiones Faciales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Expresiones faciales
Variabilidad
Complejidad
Red de Compartición de Afinidad y Diversidad de Atención Multi-cabeza
Red de Discriminación de Características
Red de Distracción de Atención
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 33
Citaciones: Sin citaciones
Las expresiones faciales exhiben similitudes inherentes, variabilidad y complejidad. En escenarios del mundo real, desafíos como las obstrucciones parciales, cambios de iluminación y diferencias individuales complican aún más la tarea de reconocimiento de expresiones faciales (FER). Para mejorar aún más la precisión de FER, se propone en este artículo una Red de Compartición de Diversidad y Afinidad de Atención Multi-cabeza (MAADS). MAADS consta de una Red de Discriminación de Características (FDN), una Red de Distracción de Atención (ADN) y una Red de Fusión Compartida (SFN). Para ser específicos, FDN primero integra pesos de atención en la función objetivo para capturar las características más discriminativas utilizando la propuesta pérdida de afinidad dispersa. Luego, ADN emplea múltiples redes de atención paralelas para maximizar la diversidad dentro de las unidades de atención espacial y las unidades de atención de canal, lo que guía a la red a centrarse en regiones faciales distintas y no superpuestas. Finalmente, SFN descompone las características faciales en partes genéricas y partes únicas, lo que permite a la red aprender las distinciones entre estas características sin tener que volver a aprender características completas desde cero. Para validar la efectividad del método propuesto, se realizaron experimentos extensos en varios conjuntos de datos ampliamente utilizados en la naturaleza, incluidos RAF-DB, AffectNet-7, AffectNet-8, FERPlus y SFEW. MAADS logra una precisión del 92.93%, 67.14%, 64.55%, 91.58% y 62.41% en estos conjuntos de datos, respectivamente. Los resultados experimentales indican que MAADS no solo supera a los métodos actuales de vanguardia en precisión de reconocimiento, sino que también tiene una complejidad computacional relativamente baja.
Descripción
Las expresiones faciales exhiben similitudes inherentes, variabilidad y complejidad. En escenarios del mundo real, desafíos como las obstrucciones parciales, cambios de iluminación y diferencias individuales complican aún más la tarea de reconocimiento de expresiones faciales (FER). Para mejorar aún más la precisión de FER, se propone en este artículo una Red de Compartición de Diversidad y Afinidad de Atención Multi-cabeza (MAADS). MAADS consta de una Red de Discriminación de Características (FDN), una Red de Distracción de Atención (ADN) y una Red de Fusión Compartida (SFN). Para ser específicos, FDN primero integra pesos de atención en la función objetivo para capturar las características más discriminativas utilizando la propuesta pérdida de afinidad dispersa. Luego, ADN emplea múltiples redes de atención paralelas para maximizar la diversidad dentro de las unidades de atención espacial y las unidades de atención de canal, lo que guía a la red a centrarse en regiones faciales distintas y no superpuestas. Finalmente, SFN descompone las características faciales en partes genéricas y partes únicas, lo que permite a la red aprender las distinciones entre estas características sin tener que volver a aprender características completas desde cero. Para validar la efectividad del método propuesto, se realizaron experimentos extensos en varios conjuntos de datos ampliamente utilizados en la naturaleza, incluidos RAF-DB, AffectNet-7, AffectNet-8, FERPlus y SFEW. MAADS logra una precisión del 92.93%, 67.14%, 64.55%, 91.58% y 62.41% en estos conjuntos de datos, respectivamente. Los resultados experimentales indican que MAADS no solo supera a los métodos actuales de vanguardia en precisión de reconocimiento, sino que también tiene una complejidad computacional relativamente baja.