Adyolov5-face: un detector de rostros basado en yolo mejorado para rostros de objetivos pequeños
Autores: Liu, Linrunjia; Wang, Gaoshuai; Miao, Qiguang
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Adyolov5-face: un detector de rostros basado en yolo mejorado para rostros de objetivos pequeños
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Avances
Detectores genéricos de objetos
Detección de rostros
Serie YOLO
Rostros pequeños
Rendimiento.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 63
Citaciones: Sin citaciones
Beneficiándose de los avances en detectores genéricos de objetos, se ha logrado un progreso significativo en el campo de la detección de rostros. Entre estos algoritmos, la serie You Only Look Once (YOLO) juega un papel importante debido a su bajo costo de computación de entrenamiento. Sin embargo, hemos observado que los detectores de rostros basados en modelos YOLO livianos tienen dificultades para detectar con precisión rostros pequeños. Esto se debe a que preservan más información semántica para rostros grandes mientras comprometen la información detallada para rostros pequeños. Para abordar este problema, este estudio realiza dos contribuciones para mejorar el rendimiento de detección, especialmente para rostros pequeños: (1) modificando la parte del cuello de la arquitectura mediante la integración de un mecanismo de Recopilación y Distribución en lugar de la tradicional Feature Pyramid Network para abordar los desafíos de fusión de información inherentes en los modelos basados en YOLO; y (2) incorporando una cabeza de detección adicional diseñada específicamente para detectar rostros pequeños. Para evaluar el rendimiento del detector de rostros propuesto, presentamos un nuevo conjunto de datos llamado XD-Face para la tarea de detección de rostros. En la sección experimental, el modelo propuesto se entrena utilizando el conjunto de datos Wider Face y se evalúa en ambos conjuntos de datos Wider Face y XD-face. Los resultados experimentales demuestran que el detector de rostros propuesto supera a otros excelentes detectores de rostros en todos los conjuntos de datos que involucran rostros pequeños y logró mejoras del 1.1%, 1.09% y 1.35% en la métrica AP50 en el conjunto de datos de validación WiderFace en comparación con el detector de rostros basado en YOLOv5s de referencia.
Descripción
Beneficiándose de los avances en detectores genéricos de objetos, se ha logrado un progreso significativo en el campo de la detección de rostros. Entre estos algoritmos, la serie You Only Look Once (YOLO) juega un papel importante debido a su bajo costo de computación de entrenamiento. Sin embargo, hemos observado que los detectores de rostros basados en modelos YOLO livianos tienen dificultades para detectar con precisión rostros pequeños. Esto se debe a que preservan más información semántica para rostros grandes mientras comprometen la información detallada para rostros pequeños. Para abordar este problema, este estudio realiza dos contribuciones para mejorar el rendimiento de detección, especialmente para rostros pequeños: (1) modificando la parte del cuello de la arquitectura mediante la integración de un mecanismo de Recopilación y Distribución en lugar de la tradicional Feature Pyramid Network para abordar los desafíos de fusión de información inherentes en los modelos basados en YOLO; y (2) incorporando una cabeza de detección adicional diseñada específicamente para detectar rostros pequeños. Para evaluar el rendimiento del detector de rostros propuesto, presentamos un nuevo conjunto de datos llamado XD-Face para la tarea de detección de rostros. En la sección experimental, el modelo propuesto se entrena utilizando el conjunto de datos Wider Face y se evalúa en ambos conjuntos de datos Wider Face y XD-face. Los resultados experimentales demuestran que el detector de rostros propuesto supera a otros excelentes detectores de rostros en todos los conjuntos de datos que involucran rostros pequeños y logró mejoras del 1.1%, 1.09% y 1.35% en la métrica AP50 en el conjunto de datos de validación WiderFace en comparación con el detector de rostros basado en YOLOv5s de referencia.