Mejorando el reconocimiento de emociones faciales utilizando una reducción de superposición basada en afinidad acoplada de autoencoder residual
Autores: Chatterjee, Sankhadeep; Das, Asit Kumar; Nayak, Janmenjoy; Pelusi, Danilo
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Mejorando el reconocimiento de emociones faciales utilizando una reducción de superposición basada en afinidad acoplada de autoencoder residual
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Reconocimiento de emociones
Imágenes faciales
Aprendizaje profundo
Clases superpuestas
Modelo AFORET
Modelo RVA
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
El reconocimiento de emociones utilizando imágenes faciales ha sido una tarea desafiante en visión por computadora. Los avances recientes en aprendizaje profundo han ayudado a lograr mejores resultados. Estudios han señalado que múltiples expresiones faciales pueden presentarse en imágenes faciales de un tipo particular de emoción. Por lo tanto, las imágenes faciales de una categoría de emoción pueden tener similitud con otras categorías de imágenes faciales, lo que lleva a la superposición de clases en el espacio de características. El problema de la superposición de clases ha sido estudiado principalmente en el contexto de clases desequilibradas. Pocos estudios han considerado el reconocimiento facial de emociones desequilibradas. Sin embargo, según el mejor conocimiento de los autores, no se ha encontrado ningún estudio sobre los efectos de las clases superpuestas en el reconocimiento de emociones. Motivado por esto, en el estudio actual, se ha propuesto una técnica de reducción de superposición basada en afinidad (AFORET) para abordar el problema de clases superpuestas en el reconocimiento facial de emociones. En primer lugar, se ha utilizado un modelo de autoencoder variacional residual (RVA) para transformar las imágenes faciales a una forma de vector latente. A continuación, el método AFORET propuesto se ha aplicado a estos vectores latentes superpuestos para reducir la superposición entre clases. El método propuesto ha sido validado mediante el entrenamiento y prueba de varios clasificadores conocidos y comparando su rendimiento en términos de un conjunto conocido de indicadores de rendimiento. Además, el método AFORET propuesto se compara con técnicas de reducción de superposición ya existentes, como los métodos OSM, -SVM y NBU. Los resultados experimentales han demostrado que el algoritmo AFORET propuesto, cuando se utiliza con el modelo RVA, mejora el rendimiento del clasificador en mayor medida al predecir la emoción humana utilizando imágenes faciales.
Descripción
El reconocimiento de emociones utilizando imágenes faciales ha sido una tarea desafiante en visión por computadora. Los avances recientes en aprendizaje profundo han ayudado a lograr mejores resultados. Estudios han señalado que múltiples expresiones faciales pueden presentarse en imágenes faciales de un tipo particular de emoción. Por lo tanto, las imágenes faciales de una categoría de emoción pueden tener similitud con otras categorías de imágenes faciales, lo que lleva a la superposición de clases en el espacio de características. El problema de la superposición de clases ha sido estudiado principalmente en el contexto de clases desequilibradas. Pocos estudios han considerado el reconocimiento facial de emociones desequilibradas. Sin embargo, según el mejor conocimiento de los autores, no se ha encontrado ningún estudio sobre los efectos de las clases superpuestas en el reconocimiento de emociones. Motivado por esto, en el estudio actual, se ha propuesto una técnica de reducción de superposición basada en afinidad (AFORET) para abordar el problema de clases superpuestas en el reconocimiento facial de emociones. En primer lugar, se ha utilizado un modelo de autoencoder variacional residual (RVA) para transformar las imágenes faciales a una forma de vector latente. A continuación, el método AFORET propuesto se ha aplicado a estos vectores latentes superpuestos para reducir la superposición entre clases. El método propuesto ha sido validado mediante el entrenamiento y prueba de varios clasificadores conocidos y comparando su rendimiento en términos de un conjunto conocido de indicadores de rendimiento. Además, el método AFORET propuesto se compara con técnicas de reducción de superposición ya existentes, como los métodos OSM, -SVM y NBU. Los resultados experimentales han demostrado que el algoritmo AFORET propuesto, cuando se utiliza con el modelo RVA, mejora el rendimiento del clasificador en mayor medida al predecir la emoción humana utilizando imágenes faciales.