S-YOLOv5: Un modelo ligero para detectar objetos arrojados desde edificios altos en comunidades
Autores: Shi, Yuntao; Luo, Qi; Zhou, Meng; Guo, Wei; Li, Jie; Li, Shuqin; Ding, Yu
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
S-YOLOv5: Un modelo ligero para detectar objetos arrojados desde edificios altos en comunidades
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Objetos
Modelo de detección
Algoritmo
Características
Red
Precisión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los objetos arrojados desde edificios altos en las comunidades se caracterizan por su pequeño tamaño, características poco conspicuas y alta velocidad. Los algoritmos existentes para detectar tales objetos enfrentan desafíos, incluidos parámetros excesivos, modelos demasiado complejos que son difíciles de implementar y una precisión de detección insuficiente. Este estudio propone un modelo de detección ligero para objetos arrojados desde edificios altos en comunidades, llamado S-YOLOv5, para abordar estos problemas. El modelo se basa en el algoritmo YOLOv5, y se elige una red neuronal convolucional ligera, Enhanced ShuffleNet (ESNet), como la red base para extraer características de la imagen. Sobre esta base, se mejora la etapa inicial de la red base y se añade el mecanismo de atención del módulo de atención simplificado (SimAM) para utilizar la rica información de posición y la información de contorno en el mapa de características superficiales para mejorar la detección de pequeños objetivos. Para la fusión de características, se diseña el módulo de Red de Agregación de Caminos Conectados Escasamente (SCPANet) para utilizar convoluciones conectadas escasamente (SCConv) en lugar de la convolución regular de la Red de Agregación de Caminos (PANet) para fusionar características de manera eficiente. Además, el modelo utiliza la función de pérdida de distancia de Wasserstein normalizada (NWD) para reducir la sensibilidad del sesgo posicional. La precisión del modelo se mejora aún más. Los resultados de las pruebas del conjunto de datos de objetos arrojados desde edificios altos que se construyó por sí mismo muestran que S-YOLOv5 puede detectar objetos arrojados desde edificios altos de manera rápida y precisa, con una precisión del 90.2% y una tasa de detección de 34.1 Fps/s. En comparación con el modelo original YOLOv5, los parámetros se reducen en un 87.3%, y la precisión y la tasa se mejoran en un 0.8% y un 63%, respectivamente.
Descripción
Los objetos arrojados desde edificios altos en las comunidades se caracterizan por su pequeño tamaño, características poco conspicuas y alta velocidad. Los algoritmos existentes para detectar tales objetos enfrentan desafíos, incluidos parámetros excesivos, modelos demasiado complejos que son difíciles de implementar y una precisión de detección insuficiente. Este estudio propone un modelo de detección ligero para objetos arrojados desde edificios altos en comunidades, llamado S-YOLOv5, para abordar estos problemas. El modelo se basa en el algoritmo YOLOv5, y se elige una red neuronal convolucional ligera, Enhanced ShuffleNet (ESNet), como la red base para extraer características de la imagen. Sobre esta base, se mejora la etapa inicial de la red base y se añade el mecanismo de atención del módulo de atención simplificado (SimAM) para utilizar la rica información de posición y la información de contorno en el mapa de características superficiales para mejorar la detección de pequeños objetivos. Para la fusión de características, se diseña el módulo de Red de Agregación de Caminos Conectados Escasamente (SCPANet) para utilizar convoluciones conectadas escasamente (SCConv) en lugar de la convolución regular de la Red de Agregación de Caminos (PANet) para fusionar características de manera eficiente. Además, el modelo utiliza la función de pérdida de distancia de Wasserstein normalizada (NWD) para reducir la sensibilidad del sesgo posicional. La precisión del modelo se mejora aún más. Los resultados de las pruebas del conjunto de datos de objetos arrojados desde edificios altos que se construyó por sí mismo muestran que S-YOLOv5 puede detectar objetos arrojados desde edificios altos de manera rápida y precisa, con una precisión del 90.2% y una tasa de detección de 34.1 Fps/s. En comparación con el modelo original YOLOv5, los parámetros se reducen en un 87.3%, y la precisión y la tasa se mejoran en un 0.8% y un 63%, respectivamente.