Red Neuronal Convolucional Espaciotemporal con Módulo de Atención de Bloque Convolucional para el Reconocimiento de Microexpresiones
Autores: Chen, Boyu; Zhang, Zhihao; Liu, Nian; Tan, Yang; Liu, Xinyu; Chen, Tong
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Red Neuronal Convolucional Espaciotemporal con Módulo de Atención de Bloque Convolucional para el Reconocimiento de Microexpresiones
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Microexpresión
Expresiones faciales
Marco de aprendizaje profundo
Mecanismo de atención visual
Red neuronal convolucional
Pesos de características
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Una microexpresión se define como un movimiento muscular incontrolable que se muestra en la cara de los humanos cuando uno intenta ocultar o reprimir sus verdaderas emociones. Muchos investigadores han aplicado el marco de aprendizaje profundo al reconocimiento de microexpresiones en los últimos años. Sin embargo, pocos han introducido el mecanismo de atención visual humana en el reconocimiento de microexpresiones. En este estudio, proponemos una red neuronal convolucional espaciotemporal tridimensional (3D) con el módulo de atención de bloque convolucional (CBAM) para el reconocimiento de microexpresiones. Primero, las secuencias de imágenes se introdujeron en una red neuronal convolucional (CNN) de tamaño mediano para extraer características visuales. Después, aprendió a asignar los pesos de las características de manera adaptativa con la ayuda de un módulo de atención de bloque convolucional. El método fue probado en bases de datos de microexpresiones espontáneas (Microexpresión II de la Academia China de Ciencias (CASME II), Base de Datos de Microexpresiones Espontáneas (SMIC)). Los resultados experimentales muestran que la CNN 3D con el módulo de atención de bloque convolucional superó a otros algoritmos en el reconocimiento de microexpresiones.
Descripción
Una microexpresión se define como un movimiento muscular incontrolable que se muestra en la cara de los humanos cuando uno intenta ocultar o reprimir sus verdaderas emociones. Muchos investigadores han aplicado el marco de aprendizaje profundo al reconocimiento de microexpresiones en los últimos años. Sin embargo, pocos han introducido el mecanismo de atención visual humana en el reconocimiento de microexpresiones. En este estudio, proponemos una red neuronal convolucional espaciotemporal tridimensional (3D) con el módulo de atención de bloque convolucional (CBAM) para el reconocimiento de microexpresiones. Primero, las secuencias de imágenes se introdujeron en una red neuronal convolucional (CNN) de tamaño mediano para extraer características visuales. Después, aprendió a asignar los pesos de las características de manera adaptativa con la ayuda de un módulo de atención de bloque convolucional. El método fue probado en bases de datos de microexpresiones espontáneas (Microexpresión II de la Academia China de Ciencias (CASME II), Base de Datos de Microexpresiones Espontáneas (SMIC)). Los resultados experimentales muestran que la CNN 3D con el módulo de atención de bloque convolucional superó a otros algoritmos en el reconocimiento de microexpresiones.