Método de detección de mascarillas en tiempo real basado en YOLOv3
Autores: Jiang, Xinbei; Gao, Tianhan; Zhu, Zichen; Zhao, Yukang
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Método de detección de mascarillas en tiempo real basado en YOLOv3
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Brote
COVID-19
Detección de mascarillas
Conjunto de datos
SE-YOLOv3
Rendimiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
El rápido brote de COVID-19 ha causado graves daños e infectado a decenas de millones de personas en todo el mundo. Dado que no hay un tratamiento específico, el uso de mascarillas se ha convertido en un método efectivo para prevenir la transmisión de COVID-19 y es obligatorio en la mayoría de las áreas públicas, lo que también ha llevado a una creciente demanda de servicios automáticos de detección de mascarillas en tiempo real para reemplazar los recordatorios manuales. Sin embargo, se están realizando pocos estudios sobre la detección de mascarillas. Es urgente mejorar el rendimiento de los detectores de mascarillas. En este documento, propusimos el Conjunto de Datos de Detección de Rostros con Mascarillas Bien Puestas (PWMFD), que incluía 9205 imágenes de muestras de uso de mascarillas con tres categorías. Además, propusimos Squeeze and Excitation (SE)-YOLOv3, un detector de mascarillas con una eficacia y eficiencia relativamente equilibradas. Integramos el mecanismo de atención al introducir el bloque SE en Darknet53 para obtener las relaciones entre los canales para que la red pueda centrarse más en la característica importante. Adoptamos la pérdida de GIoU, que puede describir mejor la diferencia espacial entre las cajas predichas y las cajas verdaderas para mejorar la estabilidad de la regresión de cajas delimitadoras. Se utilizó la pérdida focal para resolver el desequilibrio extremo entre las clases de primer plano y fondo. Además, realizamos técnicas de aumento de imagen correspondientes para mejorar aún más la robustez del modelo en la tarea específica. Los resultados experimentales mostraron que SE-YOLOv3 superó a YOLOv3 y a otros detectores de última generación en PWMFD y logró un mAP más alto del 8,6% en comparación con YOLOv3, manteniendo una velocidad de detección comparable.
Descripción
El rápido brote de COVID-19 ha causado graves daños e infectado a decenas de millones de personas en todo el mundo. Dado que no hay un tratamiento específico, el uso de mascarillas se ha convertido en un método efectivo para prevenir la transmisión de COVID-19 y es obligatorio en la mayoría de las áreas públicas, lo que también ha llevado a una creciente demanda de servicios automáticos de detección de mascarillas en tiempo real para reemplazar los recordatorios manuales. Sin embargo, se están realizando pocos estudios sobre la detección de mascarillas. Es urgente mejorar el rendimiento de los detectores de mascarillas. En este documento, propusimos el Conjunto de Datos de Detección de Rostros con Mascarillas Bien Puestas (PWMFD), que incluía 9205 imágenes de muestras de uso de mascarillas con tres categorías. Además, propusimos Squeeze and Excitation (SE)-YOLOv3, un detector de mascarillas con una eficacia y eficiencia relativamente equilibradas. Integramos el mecanismo de atención al introducir el bloque SE en Darknet53 para obtener las relaciones entre los canales para que la red pueda centrarse más en la característica importante. Adoptamos la pérdida de GIoU, que puede describir mejor la diferencia espacial entre las cajas predichas y las cajas verdaderas para mejorar la estabilidad de la regresión de cajas delimitadoras. Se utilizó la pérdida focal para resolver el desequilibrio extremo entre las clases de primer plano y fondo. Además, realizamos técnicas de aumento de imagen correspondientes para mejorar aún más la robustez del modelo en la tarea específica. Los resultados experimentales mostraron que SE-YOLOv3 superó a YOLOv3 y a otros detectores de última generación en PWMFD y logró un mAP más alto del 8,6% en comparación con YOLOv3, manteniendo una velocidad de detección comparable.