Integración de las redes ShuffleNet V2 y YOLOv5s para un modelo ligero de detección de objetos de bicicletas eléctricas dentro de ascensores
Autores: Su, Jingfang; Yang, Minrui; Tang, Xinliang
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Integración de las redes ShuffleNet V2 y YOLOv5s para un modelo ligero de detección de objetos de bicicletas eléctricas dentro de ascensores
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Bicicletas eléctricas
Modelo de detección de objetos
Ligero
Entornos de ascensores
Red YOLOv5s
Módulos Swin Transformer
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
La entrada de bicicletas eléctricas en ascensores plantea riesgos de seguridad. Este artículo propone un modelo de detección de objetos ligero para implementación en el borde en entornos de ascensores específicamente diseñados para bicicletas eléctricas. Basado en la red YOLOv5s, la red principal reemplaza el CSPDarknet53 original con una red neuronal convolucional multilayer ShuffleNet V2 ligera, logrando una red principal ligera. Se introducen módulos Swin Transformer entre capas para mejorar la capacidad de expresión de características de imágenes, y se aplica un mecanismo de atención SimAM en la capa final para mejorar aún más la capacidad de extracción de características de la red principal. En la red del cuello, módulos GSConv y VoV-GSCSP ligeros y equilibrados en profundidad reemplazan varios módulos convolucionales básicos Conv y C3, reduciendo el recuento de parámetros mientras se mejora la conexión y capacidades de fusión de características a través de escalas de mapas. La red de predicción utiliza la función de pérdida de posición EIOU de convergencia más rápida y precisa como función de pérdida de posición para el entrenamiento iterativo. Este artículo realiza varios experimentos de comparación de aligeramiento y experimentos de ablación en el modelo de detección de objetos mejorado. Los resultados experimentales demuestran que el modelo de detección de objetos propuesto, con un tamaño de modelo de solo 2,6 megabytes y 1,1 millones de parámetros, logra una velocidad de cuadro de 106 cuadros por segundo y una precisión de detección del 95,5%. Esto representa una reducción del 84,8% en la carga computacional en comparación con el modelo YOLOv5s original. El volumen y el recuento de parámetros del modelo se reducen en un 81,0% y 84,3%, respectivamente, con solo una disminución del 0,9% en mAP. El modelo de detección de objetos mejorado propuesto en este documento puede cumplir con los requisitos de detección en tiempo real para bicicletas eléctricas en escenarios de ascensores, proporcionando una solución técnica factible para su implementación en dispositivos en el borde dentro de ascensores.
Descripción
La entrada de bicicletas eléctricas en ascensores plantea riesgos de seguridad. Este artículo propone un modelo de detección de objetos ligero para implementación en el borde en entornos de ascensores específicamente diseñados para bicicletas eléctricas. Basado en la red YOLOv5s, la red principal reemplaza el CSPDarknet53 original con una red neuronal convolucional multilayer ShuffleNet V2 ligera, logrando una red principal ligera. Se introducen módulos Swin Transformer entre capas para mejorar la capacidad de expresión de características de imágenes, y se aplica un mecanismo de atención SimAM en la capa final para mejorar aún más la capacidad de extracción de características de la red principal. En la red del cuello, módulos GSConv y VoV-GSCSP ligeros y equilibrados en profundidad reemplazan varios módulos convolucionales básicos Conv y C3, reduciendo el recuento de parámetros mientras se mejora la conexión y capacidades de fusión de características a través de escalas de mapas. La red de predicción utiliza la función de pérdida de posición EIOU de convergencia más rápida y precisa como función de pérdida de posición para el entrenamiento iterativo. Este artículo realiza varios experimentos de comparación de aligeramiento y experimentos de ablación en el modelo de detección de objetos mejorado. Los resultados experimentales demuestran que el modelo de detección de objetos propuesto, con un tamaño de modelo de solo 2,6 megabytes y 1,1 millones de parámetros, logra una velocidad de cuadro de 106 cuadros por segundo y una precisión de detección del 95,5%. Esto representa una reducción del 84,8% en la carga computacional en comparación con el modelo YOLOv5s original. El volumen y el recuento de parámetros del modelo se reducen en un 81,0% y 84,3%, respectivamente, con solo una disminución del 0,9% en mAP. El modelo de detección de objetos mejorado propuesto en este documento puede cumplir con los requisitos de detección en tiempo real para bicicletas eléctricas en escenarios de ascensores, proporcionando una solución técnica factible para su implementación en dispositivos en el borde dentro de ascensores.