logo móvil
Contáctanos

Detección y reconocimiento facial a partir de imágenes y videos basado en CNN y Raspberry Pi

Autores: Zamir, Muhammad; Ali, Nouman; Naseem, Amad; Ahmed Frasteen, Areeb; Zafar, Bushra; Assam, Muhammad; Othman, Mahmoud; Attia, El-Awady

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Detección y reconocimiento facial a partir de imágenes y videos basado en CNN y Raspberry Pi


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Sistemas

Palabras clave

Contenido multimedia
Visión por computadora
Reconocimiento facial
Red neuronal convolucional
Raspberry Pi
Precisión

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 23

Citaciones: Sin citaciones


Descripción
La cantidad de contenido multimedia está creciendo exponencialmente y una parte importante del contenido multimedia utiliza imágenes y videos. Los investigadores en la comunidad de visión por computadora están explorando las posibles direcciones para mejorar la precisión y confiabilidad del sistema, y estos son los principales requisitos para los sistemas basados en visión de robots. Debido al cambio de expresiones faciales y al uso de máscaras o gafas de sol, muchos sistemas de reconocimiento facial fallan o la precisión en el reconocimiento facial disminuye en estos escenarios. En este trabajo, contribuimos con un marco de vigilancia en tiempo real utilizando Raspberry Pi y CNN (Redes Neuronales Convolucionales) para el reconocimiento facial. Hemos proporcionado un conjunto de datos etiquetado al sistema. Primero, el sistema se entrena con el conjunto de datos etiquetado para extraer diferentes características de la cara y la detección de puntos de referencia facial, luego compara la imagen de consulta con el conjunto de datos en base a las características y la detección de puntos de referencia facial. Finalmente, compara caras y votos entre ellas y da un resultado basado en votación. La precisión de clasificación del sistema basado en el modelo CNN se compara con un extractor de características de nivel medio que es Histograma de Gradiente Orientado (HOG) y los métodos de detección y reconocimiento facial de vanguardia. Además, la precisión en el reconocimiento de las caras en los casos de uso de máscaras o gafas de sol o en videos en vivo también se evalúa. La precisión más alta lograda para los conjuntos de datos VMU, reconocimiento facial y 14 celebridades es del 98%, 98.24%, 89.39% y 95.71%, respectivamente. Los resultados experimentales en bancos de imágenes estándar demuestran la efectividad de la investigación propuesta en el reconocimiento facial preciso en comparación con los métodos de detección y reconocimiento facial de vanguardia.

Otros recursos que podrían interesarte

Temas Virtualpro