Detección y reconocimiento facial a partir de imágenes y videos basado en CNN y Raspberry Pi
Autores: Zamir, Muhammad; Ali, Nouman; Naseem, Amad; Ahmed Frasteen, Areeb; Zafar, Bushra; Assam, Muhammad; Othman, Mahmoud; Attia, El-Awady
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Detección y reconocimiento facial a partir de imágenes y videos basado en CNN y Raspberry Pi
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Contenido multimedia
Visión por computadora
Reconocimiento facial
Red neuronal convolucional
Raspberry Pi
Precisión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
La cantidad de contenido multimedia está creciendo exponencialmente y una parte importante del contenido multimedia utiliza imágenes y videos. Los investigadores en la comunidad de visión por computadora están explorando las posibles direcciones para mejorar la precisión y confiabilidad del sistema, y estos son los principales requisitos para los sistemas basados en visión de robots. Debido al cambio de expresiones faciales y al uso de máscaras o gafas de sol, muchos sistemas de reconocimiento facial fallan o la precisión en el reconocimiento facial disminuye en estos escenarios. En este trabajo, contribuimos con un marco de vigilancia en tiempo real utilizando Raspberry Pi y CNN (Redes Neuronales Convolucionales) para el reconocimiento facial. Hemos proporcionado un conjunto de datos etiquetado al sistema. Primero, el sistema se entrena con el conjunto de datos etiquetado para extraer diferentes características de la cara y la detección de puntos de referencia facial, luego compara la imagen de consulta con el conjunto de datos en base a las características y la detección de puntos de referencia facial. Finalmente, compara caras y votos entre ellas y da un resultado basado en votación. La precisión de clasificación del sistema basado en el modelo CNN se compara con un extractor de características de nivel medio que es Histograma de Gradiente Orientado (HOG) y los métodos de detección y reconocimiento facial de vanguardia. Además, la precisión en el reconocimiento de las caras en los casos de uso de máscaras o gafas de sol o en videos en vivo también se evalúa. La precisión más alta lograda para los conjuntos de datos VMU, reconocimiento facial y 14 celebridades es del 98%, 98.24%, 89.39% y 95.71%, respectivamente. Los resultados experimentales en bancos de imágenes estándar demuestran la efectividad de la investigación propuesta en el reconocimiento facial preciso en comparación con los métodos de detección y reconocimiento facial de vanguardia.
Descripción
La cantidad de contenido multimedia está creciendo exponencialmente y una parte importante del contenido multimedia utiliza imágenes y videos. Los investigadores en la comunidad de visión por computadora están explorando las posibles direcciones para mejorar la precisión y confiabilidad del sistema, y estos son los principales requisitos para los sistemas basados en visión de robots. Debido al cambio de expresiones faciales y al uso de máscaras o gafas de sol, muchos sistemas de reconocimiento facial fallan o la precisión en el reconocimiento facial disminuye en estos escenarios. En este trabajo, contribuimos con un marco de vigilancia en tiempo real utilizando Raspberry Pi y CNN (Redes Neuronales Convolucionales) para el reconocimiento facial. Hemos proporcionado un conjunto de datos etiquetado al sistema. Primero, el sistema se entrena con el conjunto de datos etiquetado para extraer diferentes características de la cara y la detección de puntos de referencia facial, luego compara la imagen de consulta con el conjunto de datos en base a las características y la detección de puntos de referencia facial. Finalmente, compara caras y votos entre ellas y da un resultado basado en votación. La precisión de clasificación del sistema basado en el modelo CNN se compara con un extractor de características de nivel medio que es Histograma de Gradiente Orientado (HOG) y los métodos de detección y reconocimiento facial de vanguardia. Además, la precisión en el reconocimiento de las caras en los casos de uso de máscaras o gafas de sol o en videos en vivo también se evalúa. La precisión más alta lograda para los conjuntos de datos VMU, reconocimiento facial y 14 celebridades es del 98%, 98.24%, 89.39% y 95.71%, respectivamente. Los resultados experimentales en bancos de imágenes estándar demuestran la efectividad de la investigación propuesta en el reconocimiento facial preciso en comparación con los métodos de detección y reconocimiento facial de vanguardia.