Daam-yolov5: un algoritmo de detección de cascos combinado con caja de anclaje dinámica y mecanismo de atención
Autores: Tai, Weipeng; Wang, Zhenzhen; Li, Wei; Cheng, Jianfei; Hong, Xudong
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Daam-yolov5: un algoritmo de detección de cascos combinado con caja de anclaje dinámica y mecanismo de atención
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Algoritmos de reconocimiento de cascos
Aprendizaje profundo
DAAM-YOLOv5
Condiciones climáticas
Mecanismo de caja de anclaje dinámico
Mecanismo de atención
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 53
Citaciones: Sin citaciones
Los algoritmos de reconocimiento de cascos basados en aprendizaje profundo tienen como objetivo permitir la detección y registro ininterrumpidos de violaciones como la falta de uso de casco. Sin embargo, en escenarios reales, los factores climáticos y humanos pueden ser complicados, lo que plantea desafíos para la detección de cascos de seguridad. El temblor de la cámara y la oclusión de la cabeza son problemas comunes que pueden llevar a resultados inexactos y baja disponibilidad. Para abordar estos problemas prácticos, este documento propone un nuevo algoritmo de detección de cascos llamado DAAM-YOLOv5. El algoritmo DAAM-YOLOv5 enriquece la diversidad de conjuntos de datos bajo diferentes condiciones climáticas para mejorar el mAP del modelo en escenarios correspondientes mediante el uso de mejora de datos Mosaic-9. Además, este documento introduce un nuevo mecanismo de caja de anclaje dinámico, K-DAFS, en este algoritmo y mejora la velocidad de generación de las cajas de anclaje de destino bloqueadas mediante el uso de fusión de características bidireccionales (BFF). Además, mediante el uso de un mecanismo de atención, este documento redistribuye el peso de los objetos en una imagen y reduce adecuadamente la sensibilidad del modelo a la información de borde de los objetos ocultos a través de agrupación. Este enfoque mejora la capacidad de generalización del modelo, lo que se alinea con los requisitos de aplicación práctica. Para evaluar el algoritmo propuesto, este documento adopta la estrategia de detección de región de interés (ROI) y lleva a cabo experimentos en conjuntos de datos reales específicos. En comparación con los algoritmos tradicionales de aprendizaje profundo en los mismos conjuntos de datos, nuestro método distingue efectivamente las condiciones de uso de casco incluso cuando la información de la cabeza está oculta y mejora la velocidad de detección del modelo. Además, en comparación con el algoritmo YOLOv5s, el algoritmo propuesto aumenta el mAP y los FPS en un 4,32% y 9 fotogramas por segundo, respectivamente.
Descripción
Los algoritmos de reconocimiento de cascos basados en aprendizaje profundo tienen como objetivo permitir la detección y registro ininterrumpidos de violaciones como la falta de uso de casco. Sin embargo, en escenarios reales, los factores climáticos y humanos pueden ser complicados, lo que plantea desafíos para la detección de cascos de seguridad. El temblor de la cámara y la oclusión de la cabeza son problemas comunes que pueden llevar a resultados inexactos y baja disponibilidad. Para abordar estos problemas prácticos, este documento propone un nuevo algoritmo de detección de cascos llamado DAAM-YOLOv5. El algoritmo DAAM-YOLOv5 enriquece la diversidad de conjuntos de datos bajo diferentes condiciones climáticas para mejorar el mAP del modelo en escenarios correspondientes mediante el uso de mejora de datos Mosaic-9. Además, este documento introduce un nuevo mecanismo de caja de anclaje dinámico, K-DAFS, en este algoritmo y mejora la velocidad de generación de las cajas de anclaje de destino bloqueadas mediante el uso de fusión de características bidireccionales (BFF). Además, mediante el uso de un mecanismo de atención, este documento redistribuye el peso de los objetos en una imagen y reduce adecuadamente la sensibilidad del modelo a la información de borde de los objetos ocultos a través de agrupación. Este enfoque mejora la capacidad de generalización del modelo, lo que se alinea con los requisitos de aplicación práctica. Para evaluar el algoritmo propuesto, este documento adopta la estrategia de detección de región de interés (ROI) y lleva a cabo experimentos en conjuntos de datos reales específicos. En comparación con los algoritmos tradicionales de aprendizaje profundo en los mismos conjuntos de datos, nuestro método distingue efectivamente las condiciones de uso de casco incluso cuando la información de la cabeza está oculta y mejora la velocidad de detección del modelo. Además, en comparación con el algoritmo YOLOv5s, el algoritmo propuesto aumenta el mAP y los FPS en un 4,32% y 9 fotogramas por segundo, respectivamente.