Reconocimiento de expresiones faciales de niños utilizando características aprendidas profundamente
Autores: Laraib, Unqua; Shaukat, Arslan; Khan, Rizwan Ahmed; Mustansar, Zartasha; Akram, Muhammad Usman; Asgher, Umer
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Reconocimiento de expresiones faciales de niños utilizando características aprendidas profundamente
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Niño
Bienestar emocional
Tecnología
Reconocimiento de emociones
Expresiones faciales
Aprendizaje automático
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 49
Citaciones: Sin citaciones
El bienestar emocional de un niño es crucial para su integración exitosa en la sociedad como individuo productivo. Aunque la tecnología ha avanzado significativamente en permitir que las máquinas descifren las señales emocionales humanas, la investigación actual en reconocimiento de emociones prioriza principalmente a los adultos, ignorando el hecho de que los niños desarrollan conciencia emocional en una etapa temprana. Esto resalta la necesidad de explorar cómo las máquinas pueden reconocer expresiones faciales en niños, aunque la falta de una base de datos estandarizada presenta un desafío. En este estudio, proponemos un sistema que emplea modelos basados en Redes Neuronales Convolucionales (CNN), como VGG19, VGG16 y Resnet50, como extractores de características, y Máquina de Vectores de Soporte (SVM) y Árbol de Decisión (DT) para la clasificación, para reconocer automáticamente las expresiones de los niños utilizando un conjunto de datos de video, denominado Expresiones Faciales Espontáneas de Niños (LIRIS-CSE). Nuestro sistema se evalúa a través de varios montajes experimentales, incluyendo una división del 80-20%, Validación Cruzada K-Fold (K-Fold CV) y validación cruzada de dejar uno fuera (LOOCV), tanto para la clasificación basada en imágenes como en videos. Notablemente, nuestra investigación logra una prometedora precisión de clasificación del 99% para la clasificación basada en imágenes, utilizando características de los tres modelos con SVM utilizando una división del 80-20% y K-Fold CV. Para la clasificación basada en videos, logramos una precisión del 94% utilizando características de VGG19 con SVM utilizando LOOCV. Estos resultados superan el rendimiento del trabajo original, que informó una precisión promedio de clasificación basada en imágenes del 75% en su conjunto de datos LIRIS-CSE. Los resultados favorables obtenidos de nuestra investigación pueden allanar el camino para la aplicación práctica de nuestra metodología propuesta de reconocimiento de emociones en escenarios del mundo real.
Descripción
El bienestar emocional de un niño es crucial para su integración exitosa en la sociedad como individuo productivo. Aunque la tecnología ha avanzado significativamente en permitir que las máquinas descifren las señales emocionales humanas, la investigación actual en reconocimiento de emociones prioriza principalmente a los adultos, ignorando el hecho de que los niños desarrollan conciencia emocional en una etapa temprana. Esto resalta la necesidad de explorar cómo las máquinas pueden reconocer expresiones faciales en niños, aunque la falta de una base de datos estandarizada presenta un desafío. En este estudio, proponemos un sistema que emplea modelos basados en Redes Neuronales Convolucionales (CNN), como VGG19, VGG16 y Resnet50, como extractores de características, y Máquina de Vectores de Soporte (SVM) y Árbol de Decisión (DT) para la clasificación, para reconocer automáticamente las expresiones de los niños utilizando un conjunto de datos de video, denominado Expresiones Faciales Espontáneas de Niños (LIRIS-CSE). Nuestro sistema se evalúa a través de varios montajes experimentales, incluyendo una división del 80-20%, Validación Cruzada K-Fold (K-Fold CV) y validación cruzada de dejar uno fuera (LOOCV), tanto para la clasificación basada en imágenes como en videos. Notablemente, nuestra investigación logra una prometedora precisión de clasificación del 99% para la clasificación basada en imágenes, utilizando características de los tres modelos con SVM utilizando una división del 80-20% y K-Fold CV. Para la clasificación basada en videos, logramos una precisión del 94% utilizando características de VGG19 con SVM utilizando LOOCV. Estos resultados superan el rendimiento del trabajo original, que informó una precisión promedio de clasificación basada en imágenes del 75% en su conjunto de datos LIRIS-CSE. Los resultados favorables obtenidos de nuestra investigación pueden allanar el camino para la aplicación práctica de nuestra metodología propuesta de reconocimiento de emociones en escenarios del mundo real.