logo móvil
Contáctanos

Reconocimiento de Expresiones Faciales Integrando Restricciones Escasas de Características en Múltiples Etapas y Aprendizaje de Gráficos de Regiones Clave

Autores: Xu, Guanghui; Hong, Yan; Zhao, Wanli; Mao, Zhongjie; Li, Duantengchuan; Li, Yue

Idioma: Inglés

Editor: MDPI

Año: 2026

Descargar PDF

Acceso abierto

Artículo científico
2026

Reconocimiento de Expresiones Faciales Integrando Restricciones Escasas de Características en Múltiples Etapas y Aprendizaje de Gráficos de Regiones Clave


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Reconocimiento de expresiones faciales
Restricciones escasas de características en múltiples etapas
Selección de ventanas escasas basada en atención a múltiples escalas
Aprendizaje de gráficos de regiones clave
Módulo de fusión guiado globalmente
Parches faciales discriminativos

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Los métodos actuales de reconocimiento de expresiones faciales suelen extraer características faciales de manera indiscriminada, incorporando información irrelevante para la expresión que compromete la precisión del reconocimiento. Para superar esto, proponemos las Restricciones Escasas de Características en Múltiples Etapas (MFSC), un modelo novedoso que integra un mecanismo de Selección de Ventanas Escasas Basado en Atención Multiescala (MSAWS) con el aprendizaje de gráficos de regiones clave. Notablemente, MFSC opera sin depender de puntos de referencia faciales preextraídos, lo que permite un despliegue más flexible. El mecanismo MSAWS filtra progresivamente características redundantes a través de una atención escasa en múltiples etapas, seleccionando de manera adaptativa los parches faciales más discriminativos. Los tokens seleccionados se estructuran en un gráfico dinámico para modelar relaciones regionales a través de redes neuronales de gráficos (GNN). Críticamente, nuestro marco introduce además un módulo de fusión guiada globalmente, que integra de manera efectiva características locales de alta resolución de un backbone IR50 con las características topológicas globales de la GNN a través de atención cruzada. Esta integración permite aprovechar las fortalezas complementarias, donde los detalles locales se ven mejorados por el contexto semántico global. Experimentos exhaustivos en los conjuntos de datos RAF-DB, FER2013 y AffectNet-7 demuestran el rendimiento superior de MFSC, logrando una precisión de vanguardia del 92.31%, 76.21% y 67.35%, respectivamente. Estos resultados validan la efectividad de nuestro enfoque en enfocar los recursos computacionales en regiones salientes de expresión mientras se mantiene una arquitectura ligera y eficiente.

Otros recursos que podrían interesarte

Temas Virtualpro