logo móvil
Contáctanos

Un enfoque eficiente de caja de anclaje multi-escala para detectar caras parciales en una secuencia de video

Autores: Garg, Dweepna; Jain, Priyanka; Kotecha, Ketan; Goel, Parth; Varadarajan, Vijayakumar

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Un enfoque eficiente de caja de anclaje multi-escala para detectar caras parciales en una secuencia de video


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Sistemas

Palabras clave

Detección de rostros
Técnicas de aprendizaje profundo
Detección parcial de rostros
Características ocultas
Red neuronal convolucional
Cajas de anclaje

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 29

Citaciones: Sin citaciones


Descripción
En los últimos años, la detección facial ha logrado considerable atención en el campo de la visión por computadora utilizando técnicas de aprendizaje automático tradicionales y técnicas de aprendizaje profundo. El aprendizaje profundo se utiliza para construir los algoritmos de detección facial más recientes y potentes. Sin embargo, la detección parcial de rostros aún sigue sin lograr un rendimiento notable. Los rostros parciales están ocultos debido al cabello, sombreros, gafas, manos, teléfonos móviles e imágenes capturadas desde un ángulo lateral. Menos rasgos faciales pueden ser identificados en tales imágenes. En este documento, presentamos un método de detección facial de redes neuronales convolucionales profundas utilizando la estrategia de sección de cuadros de anclaje. Limitamos el número de cuadros de anclaje y escalas y elegimos solo los relevantes para la forma del rostro. El modelo propuesto fue entrenado y probado en un conjunto de datos de referencia de detección facial popular y desafiante, es decir, el Conjunto de Datos y Referencia de Detección Facial (FDDB), y también puede detectar rostros parcialmente cubiertos con una mayor precisión y exactitud. Se realizaron experimentos extensos, con métricas de evaluación que incluyen precisión, exactitud, recuperación, puntuación F1, tiempo de inferencia y FPS. Los resultados muestran que el modelo propuesto es capaz de detectar el rostro en la imagen, incluidos los rasgos ocultos, de manera más precisa que otros enfoques de última generación, logrando una precisión del 94.8% y una precisión del 98.7% en el conjunto de datos FDDB a 21 cuadros por segundo (FPS).

Otros recursos que podrían interesarte

Temas Virtualpro