Un estudio comparativo de descriptores de imagen en el reconocimiento de rostros humanos respaldado por plataformas distribuidas
Autores: Alreshidi, Eissa; Ramadan, Rabie A.; Sharif, Md. Haidar; Ince, Omer Faruk; Ince, Ibrahim Furkan
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Un estudio comparativo de descriptores de imagen en el reconocimiento de rostros humanos respaldado por plataformas distribuidas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Reconocimiento facial
Monitoreo de seguridad
Manipulación de ruido
Descriptores
Marco de trabajo
Recuperación de imágenes
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 63
Citaciones: Sin citaciones
El reconocimiento facial es una de las tecnologías emergentes que se ha utilizado en muchas aplicaciones. Es un proceso de etiquetado de imágenes, especialmente aquellas con rostros humanos. Una de las aplicaciones críticas del reconocimiento facial es la monitorización de la seguridad, donde las imágenes capturadas se comparan con miles, o incluso millones, de imágenes almacenadas. El problema surge cuando diferentes tipos de ruido manipulan las imágenes capturadas. Este documento contribuye al cuerpo del conocimiento al proponer un marco innovador para el reconocimiento facial basado en varios descriptores, incluidos los siguientes: Descriptores de Color y Direccionalidad de Bordes (CEDD), Descriptores de Histograma de Color y Textura Difusa (FCTH), Histograma de Color, Diseño de Color, Histograma de Bordes, Gabor, Hashing CEDD, Descriptores Compuestos Conjuntos (JCD), Histograma Conjunto, Diseño de Luminancia, Histograma Oponente, Descriptor de Pirámide de Histogramas de Gradiente (PHOG), Tamura. El marco propuesto considera fases de indexación y recuperación de conjuntos de imágenes con descriptores multifuncionales. El conjunto de datos examinado contiene 23,707 imágenes de diferentes géneros y edades, que van desde 1 hasta 116 años. El marco se examina exhaustivamente con diferentes filtros de imagen como ruido aleatorio, rotación, recorte, brillo, inversión y escala de grises. El rendimiento del indexador se mide en función de un entorno distribuido basado en el tamaño de la muestra y multiprocesadores, así como en subprocesos múltiples. Además, el rendimiento de la recuperación de imágenes se mide utilizando tres criterios: rango, puntuación y precisión. El marco implementado pudo reconocer las imágenes manipuladas utilizando diferentes descriptores con una alta tasa de precisión. El marco innovador propuesto demuestra que los descriptores de imagen podrían ser eficientes en el reconocimiento facial incluso con ruido añadido a las imágenes basado en los resultados. Los resultados concluyentes son los siguientes: (a) el Histograma de Bordes podría ser mejor utilizado con imágenes brillantes, en gris e invertidas; (b) el FCTH, Histograma de Color, Diseño de Color e Histograma Conjunto podrían ser mejor utilizados con imágenes recortadas; y (c) el CEDD podría ser mejor utilizado con ruido aleatorio e imágenes rotadas.
Descripción
El reconocimiento facial es una de las tecnologías emergentes que se ha utilizado en muchas aplicaciones. Es un proceso de etiquetado de imágenes, especialmente aquellas con rostros humanos. Una de las aplicaciones críticas del reconocimiento facial es la monitorización de la seguridad, donde las imágenes capturadas se comparan con miles, o incluso millones, de imágenes almacenadas. El problema surge cuando diferentes tipos de ruido manipulan las imágenes capturadas. Este documento contribuye al cuerpo del conocimiento al proponer un marco innovador para el reconocimiento facial basado en varios descriptores, incluidos los siguientes: Descriptores de Color y Direccionalidad de Bordes (CEDD), Descriptores de Histograma de Color y Textura Difusa (FCTH), Histograma de Color, Diseño de Color, Histograma de Bordes, Gabor, Hashing CEDD, Descriptores Compuestos Conjuntos (JCD), Histograma Conjunto, Diseño de Luminancia, Histograma Oponente, Descriptor de Pirámide de Histogramas de Gradiente (PHOG), Tamura. El marco propuesto considera fases de indexación y recuperación de conjuntos de imágenes con descriptores multifuncionales. El conjunto de datos examinado contiene 23,707 imágenes de diferentes géneros y edades, que van desde 1 hasta 116 años. El marco se examina exhaustivamente con diferentes filtros de imagen como ruido aleatorio, rotación, recorte, brillo, inversión y escala de grises. El rendimiento del indexador se mide en función de un entorno distribuido basado en el tamaño de la muestra y multiprocesadores, así como en subprocesos múltiples. Además, el rendimiento de la recuperación de imágenes se mide utilizando tres criterios: rango, puntuación y precisión. El marco implementado pudo reconocer las imágenes manipuladas utilizando diferentes descriptores con una alta tasa de precisión. El marco innovador propuesto demuestra que los descriptores de imagen podrían ser eficientes en el reconocimiento facial incluso con ruido añadido a las imágenes basado en los resultados. Los resultados concluyentes son los siguientes: (a) el Histograma de Bordes podría ser mejor utilizado con imágenes brillantes, en gris e invertidas; (b) el FCTH, Histograma de Color, Diseño de Color e Histograma Conjunto podrían ser mejor utilizados con imágenes recortadas; y (c) el CEDD podría ser mejor utilizado con ruido aleatorio e imágenes rotadas.