Un modelo de detección de uso de mascarilla en escenarios complejos basado en YOLOv7-CPCSDSA
Autores: Wang, Jingyang; Wang, Junkai; Zhang, Xiaotian; Yu, Naiwen
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un modelo de detección de uso de mascarilla en escenarios complejos basado en YOLOv7-CPCSDSA
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Tecnología de aprendizaje profundo
Detección de uso de mascarilla
YOLOv7-CPCSDSA
CatPConv
Módulo de detección pequeño
Mecanismo de atención Shuffle
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 42
Citaciones: Sin citaciones
Con el rápido desarrollo de la tecnología de aprendizaje profundo, muchos algoritmos para la detección del uso de mascarillas han logrado resultados notables. Sin embargo, el efecto de detección aún necesita ser mejorado al tratar con el uso de mascarillas en escenas complejas donde los objetivos son demasiado densos u ocultos parcialmente. Este artículo propone un nuevo modelo de detección del uso de mascarillas: YOLOv7-CPCSDSA. Basado en YOLOv7, este modelo reemplaza algunas convoluciones del modelo original, CatConv, con la convolución parcial de FasterNet (PConv) para formar una estructura CatPConv (CPC), que puede reducir la redundancia computacional y el acceso a la memoria. En el caso de un aumento en la capa de red, los parámetros se reducen en su lugar. Se añade al modelo el módulo de Detección Pequeña (SD), que incluye estructuras como upsampling, convolución de concatenación y MaxPooling para mejorar la capacidad de capturar objetivos pequeños, mejorando así la precisión de detección. Además, se introduce el mecanismo de Atención Shuffle (SA), que permite que el modelo se enfoque de forma adaptativa en información local importante, mejorando así la precisión de la detección del uso de mascarillas. Este artículo utiliza experimentos comparativos y de ablación en el conjunto de datos de mascarillas (que incluye muchas imágenes en escenarios complejos) para verificar la efectividad del modelo. Los resultados muestran que la precisión media promedio@0.5 (mAP@0.5) de YOLOv7-CPCSDSA alcanza el 88.4%, que es 1.9% más alto que el de YOLOv7, y su tasa de frames por segundo (FPS) alcanza los 75.8 f/s, cumpliendo con los requisitos de detección en tiempo real. Por lo tanto, YOLOv7-CPCSDSA es adecuado para detectar el uso de mascarillas en escenarios complejos.
Descripción
Con el rápido desarrollo de la tecnología de aprendizaje profundo, muchos algoritmos para la detección del uso de mascarillas han logrado resultados notables. Sin embargo, el efecto de detección aún necesita ser mejorado al tratar con el uso de mascarillas en escenas complejas donde los objetivos son demasiado densos u ocultos parcialmente. Este artículo propone un nuevo modelo de detección del uso de mascarillas: YOLOv7-CPCSDSA. Basado en YOLOv7, este modelo reemplaza algunas convoluciones del modelo original, CatConv, con la convolución parcial de FasterNet (PConv) para formar una estructura CatPConv (CPC), que puede reducir la redundancia computacional y el acceso a la memoria. En el caso de un aumento en la capa de red, los parámetros se reducen en su lugar. Se añade al modelo el módulo de Detección Pequeña (SD), que incluye estructuras como upsampling, convolución de concatenación y MaxPooling para mejorar la capacidad de capturar objetivos pequeños, mejorando así la precisión de detección. Además, se introduce el mecanismo de Atención Shuffle (SA), que permite que el modelo se enfoque de forma adaptativa en información local importante, mejorando así la precisión de la detección del uso de mascarillas. Este artículo utiliza experimentos comparativos y de ablación en el conjunto de datos de mascarillas (que incluye muchas imágenes en escenarios complejos) para verificar la efectividad del modelo. Los resultados muestran que la precisión media promedio@0.5 (mAP@0.5) de YOLOv7-CPCSDSA alcanza el 88.4%, que es 1.9% más alto que el de YOLOv7, y su tasa de frames por segundo (FPS) alcanza los 75.8 f/s, cumpliendo con los requisitos de detección en tiempo real. Por lo tanto, YOLOv7-CPCSDSA es adecuado para detectar el uso de mascarillas en escenarios complejos.