Aprendiendo representación de movimiento facial con un codificador ligero para verificación de identidad
Autores: Sun, Zheng; Sumsion, Andrew W.; Torrie, Shad A.; Lee, Dah-Jye
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Aprendiendo representación de movimiento facial con un codificador ligero para verificación de identidad
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Clasificación de imágenes
Detección de objetos
Aprendizaje profundo
Reconocimiento facial
Detección de puntos de referencia faciales
Verificación de identidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
El aprendizaje profundo se convirtió en una técnica importante de clasificación de imágenes y detección de objetos hace más de una década. Desde entonces, ha logrado un rendimiento similar al humano para muchas tareas de visión por computadora. Algunas de ellas implican el análisis del rostro humano para aplicaciones como reconocimiento facial, reconocimiento de expresiones y detección de puntos de referencia faciales. En los últimos años, los investigadores han generado y puesto a disposición del público muchos conjuntos de datos valiosos que permiten el desarrollo de modelos más precisos y robustos para estas tareas importantes. Explotar la información contenida en estas estructuras profundas preentrenadas podría abrir la puerta a muchas nuevas aplicaciones y proporcionar un camino rápido hacia su éxito. Esta investigación se centra en una aplicación única que analiza videos cortos de movimiento facial para la verificación de identidad. Nuestra solución propuesta aprovecha la rica información en esas estructuras profundas para proporcionar una representación precisa del rostro para el análisis del movimiento facial. Hemos desarrollado dos estrategias para emplear la información contenida en los modelos existentes para el análisis facial basado en imágenes y aprender las representaciones del movimiento facial para nuestra aplicación. Combinando esos extractores de características espaciales preentrenados para análisis relacionados con el rostro, nuestro codificador de secuencias personalizado es capaz de generar una incrustación precisa del movimiento facial para la aplicación de verificación de identidad. Los resultados experimentales muestran que la información de la geometría facial de esos extractores de características es valiosa y ayuda a que nuestro modelo logre una impresionante precisión promedio del 98.8% para la verificación de identidad utilizando el movimiento facial.
Descripción
El aprendizaje profundo se convirtió en una técnica importante de clasificación de imágenes y detección de objetos hace más de una década. Desde entonces, ha logrado un rendimiento similar al humano para muchas tareas de visión por computadora. Algunas de ellas implican el análisis del rostro humano para aplicaciones como reconocimiento facial, reconocimiento de expresiones y detección de puntos de referencia faciales. En los últimos años, los investigadores han generado y puesto a disposición del público muchos conjuntos de datos valiosos que permiten el desarrollo de modelos más precisos y robustos para estas tareas importantes. Explotar la información contenida en estas estructuras profundas preentrenadas podría abrir la puerta a muchas nuevas aplicaciones y proporcionar un camino rápido hacia su éxito. Esta investigación se centra en una aplicación única que analiza videos cortos de movimiento facial para la verificación de identidad. Nuestra solución propuesta aprovecha la rica información en esas estructuras profundas para proporcionar una representación precisa del rostro para el análisis del movimiento facial. Hemos desarrollado dos estrategias para emplear la información contenida en los modelos existentes para el análisis facial basado en imágenes y aprender las representaciones del movimiento facial para nuestra aplicación. Combinando esos extractores de características espaciales preentrenados para análisis relacionados con el rostro, nuestro codificador de secuencias personalizado es capaz de generar una incrustación precisa del movimiento facial para la aplicación de verificación de identidad. Los resultados experimentales muestran que la información de la geometría facial de esos extractores de características es valiosa y ayuda a que nuestro modelo logre una impresionante precisión promedio del 98.8% para la verificación de identidad utilizando el movimiento facial.