Una red de afinidad de contraste extra para el reconocimiento de expresiones faciales en la naturaleza
Autores: Zhu, Jiaqi; Liu, Shuaishi; Yu, Siyang; Song, Yihu
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Una red de afinidad de contraste extra para el reconocimiento de expresiones faciales en la naturaleza
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Reconocimiento de expresiones faciales
Características discriminativas
Aprendizaje contrastivo
Características profundas
Desequilibrio de clases
Funciones de pérdida
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
Aprender características discriminativas para el reconocimiento de expresiones faciales (FER) en la naturaleza es una tarea desafiante debido a las significativas variaciones intraclase, similitudes interclase y desequilibrios extremos de clases. Para resolver estos problemas, se propone un método de red de afinidad de contraste basado en el aprendizaje contrastivo (ECAN). El ECAN consta de una red de procesamiento de características y dos funciones de pérdida propuestas, a saber, pérdida de contraste supervisada negativa adicional (ENSC loss) y pérdida de afinidad de múltiples vistas (MVA loss). La red de procesamiento de características proporciona características profundas actuales e históricas para satisfacer las condiciones necesarias para estas funciones de pérdida. Específicamente, la función de pérdida ENSC considera simultáneamente muchas muestras positivas y muestras negativas adicionales de otros minibatches para maximizar la similitud intraclase y la separación interclase de las características profundas, mientras que también dirige automáticamente la atención del modelo a las clases mayoritarias y minoritarias para aliviar el problema del desequilibrio de clases. La función de pérdida MVA mejora la función de pérdida de centro aprovechando grupos de características profundas adicionales de otros minibatches para aprender dinámicamente centros de clase más precisos y mejorar aún más la compacidad intraclase de las características profundas. Los resultados numéricos obtenidos utilizando dos conjuntos de datos públicos de FER en la naturaleza (RAFDB y FER2013) indican que el método propuesto supera a la mayoría de los modelos de vanguardia en FER.
Descripción
Aprender características discriminativas para el reconocimiento de expresiones faciales (FER) en la naturaleza es una tarea desafiante debido a las significativas variaciones intraclase, similitudes interclase y desequilibrios extremos de clases. Para resolver estos problemas, se propone un método de red de afinidad de contraste basado en el aprendizaje contrastivo (ECAN). El ECAN consta de una red de procesamiento de características y dos funciones de pérdida propuestas, a saber, pérdida de contraste supervisada negativa adicional (ENSC loss) y pérdida de afinidad de múltiples vistas (MVA loss). La red de procesamiento de características proporciona características profundas actuales e históricas para satisfacer las condiciones necesarias para estas funciones de pérdida. Específicamente, la función de pérdida ENSC considera simultáneamente muchas muestras positivas y muestras negativas adicionales de otros minibatches para maximizar la similitud intraclase y la separación interclase de las características profundas, mientras que también dirige automáticamente la atención del modelo a las clases mayoritarias y minoritarias para aliviar el problema del desequilibrio de clases. La función de pérdida MVA mejora la función de pérdida de centro aprovechando grupos de características profundas adicionales de otros minibatches para aprender dinámicamente centros de clase más precisos y mejorar aún más la compacidad intraclase de las características profundas. Los resultados numéricos obtenidos utilizando dos conjuntos de datos públicos de FER en la naturaleza (RAFDB y FER2013) indican que el método propuesto supera a la mayoría de los modelos de vanguardia en FER.