Un sistema de reconocimiento de expresiones faciales en tiempo real y preservación de la privacidad utilizando un microcontrolador impulsado por IA
Autores: Zhang, Jiajin; Xie, Xiaolong; Peng, Guoying; Liu, Li; Yang, Hongyu; Guo, Rong; Cao, Juntao; Yang, Jianke
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un sistema de reconocimiento de expresiones faciales en tiempo real y preservación de la privacidad utilizando un microcontrolador impulsado por IA
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Propone un sistema de reconocimiento de expresiones faciales en el borde
De bajo costo
Preservación de la privacidad
Modelo de aprendizaje profundo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
Este estudio propone un sistema de reconocimiento de expresiones faciales basado en computación en el borde que es de bajo costo, bajo consumo de energía y preserva la privacidad. Utiliza un sistema basado en gorra mínimamente intrusivo diseñado para el monitoreo continuo y en tiempo real de las expresiones faciales de un usuario. El método propuesto se centra en detectar deformaciones en la piel facial que acompañan los cambios en las expresiones faciales. Un sensor de profundidad de zona múltiple de tiempo de vuelo (ToF) VL53L5CX, que cuenta con una imagen de profundidad de 8 x 8, se integra en el borde frontal de la gorra para medir la distancia entre el sensor y la superficie de la piel facial del usuario. Los valores de distancia correspondientes a siete expresiones faciales universales (neutral, feliz, asco, enojo, sorpresa, miedo y tristeza) se transmiten a un microcontrolador STM32F476 de bajo consumo de energía como un dispositivo en el borde para tareas de preprocesamiento de datos y clasificación de expresiones faciales utilizando un modelo de aprendizaje profundo preentrenado en el dispositivo. La evaluación del rendimiento del sistema se lleva a cabo a través de experimentos utilizando datos recolectados de 20 sujetos. Se evalúan cuatro algoritmos de aprendizaje profundo, incluidas Redes Neuronales Convolucionales (CNN), Redes Neuronales Recurrentes (RNN), redes de memoria a corto y largo plazo (LSTM) y Redes Neuronales Profundas (DNN). Estos algoritmos demuestran una alta precisión, con CNN obteniendo el mejor resultado, logrando una precisión del 89.20% a una velocidad de cuadro de 15 cuadros por segundo (fps) y una latencia máxima de 2 ms.
Descripción
Este estudio propone un sistema de reconocimiento de expresiones faciales basado en computación en el borde que es de bajo costo, bajo consumo de energía y preserva la privacidad. Utiliza un sistema basado en gorra mínimamente intrusivo diseñado para el monitoreo continuo y en tiempo real de las expresiones faciales de un usuario. El método propuesto se centra en detectar deformaciones en la piel facial que acompañan los cambios en las expresiones faciales. Un sensor de profundidad de zona múltiple de tiempo de vuelo (ToF) VL53L5CX, que cuenta con una imagen de profundidad de 8 x 8, se integra en el borde frontal de la gorra para medir la distancia entre el sensor y la superficie de la piel facial del usuario. Los valores de distancia correspondientes a siete expresiones faciales universales (neutral, feliz, asco, enojo, sorpresa, miedo y tristeza) se transmiten a un microcontrolador STM32F476 de bajo consumo de energía como un dispositivo en el borde para tareas de preprocesamiento de datos y clasificación de expresiones faciales utilizando un modelo de aprendizaje profundo preentrenado en el dispositivo. La evaluación del rendimiento del sistema se lleva a cabo a través de experimentos utilizando datos recolectados de 20 sujetos. Se evalúan cuatro algoritmos de aprendizaje profundo, incluidas Redes Neuronales Convolucionales (CNN), Redes Neuronales Recurrentes (RNN), redes de memoria a corto y largo plazo (LSTM) y Redes Neuronales Profundas (DNN). Estos algoritmos demuestran una alta precisión, con CNN obteniendo el mejor resultado, logrando una precisión del 89.20% a una velocidad de cuadro de 15 cuadros por segundo (fps) y una latencia máxima de 2 ms.