Hr-yolo: un modelo de red de múltiples sucursales para la detección de cascos combinado con una red de alta resolución y YOLOv5
Autores: Lian, Yuanfeng; Li, Jing; Dong, Shaohua; Li, Xingtao
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Hr-yolo: un modelo de red de múltiples sucursales para la detección de cascos combinado con una red de alta resolución y YOLOv5
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Casco de seguridad
Detección
Aprendizaje profundo
Marco de trabajo
Postura humana
Precisión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
La detección automática del uso de casco de seguridad es significativa para garantizar una producción segura. Sin embargo, la precisión de la detección de cascos de seguridad puede ser desafiada por varios factores, como entornos complejos, condiciones de iluminación deficientes y objetivos de tamaño pequeño. Este documento presenta un marco de aprendizaje profundo novedoso y eficiente llamado High-Resolution You Only Look Once (HR-YOLO) para la detección del uso de cascos de seguridad. El marco propuesto sintetiza la información sobre el uso de cascos de seguridad a partir de las características de los objetos de casco y la postura humana. HR-YOLO puede utilizar características de dos ramas para hacer que la predicción de supresión de cuadros delimitadores sea más precisa para objetivos pequeños. Luego, para mejorar aún más la eficiencia y precisión iterativas del modelo, diseñamos una estructura de red residual optimizada utilizando Optimized Powered Stochastic Gradient Descent (OP-SGD). Además, se diseñó un Modelo de Atención Consciente de Laplace (LAAM) para que el decodificador YOLOv5 preste más atención a la información de características de la postura humana y suprima la interferencia de características irrelevantes, lo que mejora la representación de la red. Finalmente, se propone la votación de supresión de no máximo (votación PA-NMS) para mejorar la precisión de detección de objetivos ocultos, utilizando información de postura para restringir la confianza de los cuadros delimitadores y seleccionar cuadros delimitadores óptimos a través de un proceso de votación modificado. Los resultados experimentales demuestran que la red de detección de cascos de seguridad presentada supera a otros enfoques y tiene valor práctico en escenarios de aplicación. En comparación con otros algoritmos, el algoritmo propuesto mejora la precisión, la recuperación y el mAP en un 7,27%, 5,46% y 7,3%, respectivamente, en promedio.
Descripción
La detección automática del uso de casco de seguridad es significativa para garantizar una producción segura. Sin embargo, la precisión de la detección de cascos de seguridad puede ser desafiada por varios factores, como entornos complejos, condiciones de iluminación deficientes y objetivos de tamaño pequeño. Este documento presenta un marco de aprendizaje profundo novedoso y eficiente llamado High-Resolution You Only Look Once (HR-YOLO) para la detección del uso de cascos de seguridad. El marco propuesto sintetiza la información sobre el uso de cascos de seguridad a partir de las características de los objetos de casco y la postura humana. HR-YOLO puede utilizar características de dos ramas para hacer que la predicción de supresión de cuadros delimitadores sea más precisa para objetivos pequeños. Luego, para mejorar aún más la eficiencia y precisión iterativas del modelo, diseñamos una estructura de red residual optimizada utilizando Optimized Powered Stochastic Gradient Descent (OP-SGD). Además, se diseñó un Modelo de Atención Consciente de Laplace (LAAM) para que el decodificador YOLOv5 preste más atención a la información de características de la postura humana y suprima la interferencia de características irrelevantes, lo que mejora la representación de la red. Finalmente, se propone la votación de supresión de no máximo (votación PA-NMS) para mejorar la precisión de detección de objetivos ocultos, utilizando información de postura para restringir la confianza de los cuadros delimitadores y seleccionar cuadros delimitadores óptimos a través de un proceso de votación modificado. Los resultados experimentales demuestran que la red de detección de cascos de seguridad presentada supera a otros enfoques y tiene valor práctico en escenarios de aplicación. En comparación con otros algoritmos, el algoritmo propuesto mejora la precisión, la recuperación y el mAP en un 7,27%, 5,46% y 7,3%, respectivamente, en promedio.