Reconocimiento de Expresiones Faciales Integrando Restricciones Escasas de Características en Múltiples Etapas y Aprendizaje de Gráficos de Regiones Clave
Autores: Xu, Guanghui; Hong, Yan; Zhao, Wanli; Mao, Zhongjie; Li, Duantengchuan; Li, Yue
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Reconocimiento de Expresiones Faciales Integrando Restricciones Escasas de Características en Múltiples Etapas y Aprendizaje de Gráficos de Regiones Clave
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Reconocimiento de expresiones faciales
Restricciones escasas de características en múltiples etapas
Selección de ventanas escasas basada en atención a múltiples escalas
Aprendizaje de gráficos de regiones clave
Módulo de fusión guiado globalmente
Parches faciales discriminativos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los métodos actuales de reconocimiento de expresiones faciales suelen extraer características faciales de manera indiscriminada, incorporando información irrelevante para la expresión que compromete la precisión del reconocimiento. Para superar esto, proponemos las Restricciones Escasas de Características en Múltiples Etapas (MFSC), un modelo novedoso que integra un mecanismo de Selección de Ventanas Escasas Basado en Atención Multiescala (MSAWS) con el aprendizaje de gráficos de regiones clave. Notablemente, MFSC opera sin depender de puntos de referencia faciales preextraídos, lo que permite un despliegue más flexible. El mecanismo MSAWS filtra progresivamente características redundantes a través de una atención escasa en múltiples etapas, seleccionando de manera adaptativa los parches faciales más discriminativos. Los tokens seleccionados se estructuran en un gráfico dinámico para modelar relaciones regionales a través de redes neuronales de gráficos (GNN). Críticamente, nuestro marco introduce además un módulo de fusión guiada globalmente, que integra de manera efectiva características locales de alta resolución de un backbone IR50 con las características topológicas globales de la GNN a través de atención cruzada. Esta integración permite aprovechar las fortalezas complementarias, donde los detalles locales se ven mejorados por el contexto semántico global. Experimentos exhaustivos en los conjuntos de datos RAF-DB, FER2013 y AffectNet-7 demuestran el rendimiento superior de MFSC, logrando una precisión de vanguardia del 92.31%, 76.21% y 67.35%, respectivamente. Estos resultados validan la efectividad de nuestro enfoque en enfocar los recursos computacionales en regiones salientes de expresión mientras se mantiene una arquitectura ligera y eficiente.
Descripción
Los métodos actuales de reconocimiento de expresiones faciales suelen extraer características faciales de manera indiscriminada, incorporando información irrelevante para la expresión que compromete la precisión del reconocimiento. Para superar esto, proponemos las Restricciones Escasas de Características en Múltiples Etapas (MFSC), un modelo novedoso que integra un mecanismo de Selección de Ventanas Escasas Basado en Atención Multiescala (MSAWS) con el aprendizaje de gráficos de regiones clave. Notablemente, MFSC opera sin depender de puntos de referencia faciales preextraídos, lo que permite un despliegue más flexible. El mecanismo MSAWS filtra progresivamente características redundantes a través de una atención escasa en múltiples etapas, seleccionando de manera adaptativa los parches faciales más discriminativos. Los tokens seleccionados se estructuran en un gráfico dinámico para modelar relaciones regionales a través de redes neuronales de gráficos (GNN). Críticamente, nuestro marco introduce además un módulo de fusión guiada globalmente, que integra de manera efectiva características locales de alta resolución de un backbone IR50 con las características topológicas globales de la GNN a través de atención cruzada. Esta integración permite aprovechar las fortalezas complementarias, donde los detalles locales se ven mejorados por el contexto semántico global. Experimentos exhaustivos en los conjuntos de datos RAF-DB, FER2013 y AffectNet-7 demuestran el rendimiento superior de MFSC, logrando una precisión de vanguardia del 92.31%, 76.21% y 67.35%, respectivamente. Estos resultados validan la efectividad de nuestro enfoque en enfocar los recursos computacionales en regiones salientes de expresión mientras se mantiene una arquitectura ligera y eficiente.