Un algoritmo de reconocimiento de peatones en paralelo a múltiples escalas basado en YOLOv5
Autores: Song, Qi; Zhou, ZongHe; Ji, ShuDe; Cui, Tong; Yao, BuDan; Liu, ZeQi
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un algoritmo de reconocimiento de peatones en paralelo a múltiples escalas basado en YOLOv5
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Algoritmos de reconocimiento de peatones
YOLO-MSP
En paralelo a varias escalas
Red residual
Módulo Swin Transformer
Módulo CBAMC3
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
Los algoritmos convencionales de reconocimiento de peatones tienen problemas como baja precisión y rendimiento insuficiente en tiempo real. En este estudio, desarrollamos un algoritmo mejorado de reconocimiento de peatones llamado YOLO-MSP (paralelo a escala múltiple) basado en ideas de redes residuales, y mejoramos la arquitectura de la red basada en YOLOv5s. Se utilizaron tres capas de agrupación en paralelo en el módulo MSP para generar características a escala múltiple y mejorar la precisión del modelo asegurando el rendimiento en tiempo real. También se introdujo el módulo Swin Transformer en la red, lo que mejoró la eficiencia del modelo en el procesamiento de imágenes al evitar cálculos globales. Se añadió el mecanismo de atención CBAM (Convolutional Block Attention Module) al módulo C3, y este nuevo módulo se denominó módulo CBAMC3, lo que mejoró la eficiencia del modelo asegurando que fuera ligero. La función de pérdida WMD-IOU (intersección sobre unión multidimensional ponderada) propuesta en este estudio utilizó el cambio de forma entre el marco de reconocimiento y el marco real como un parámetro para calcular la pérdida de la forma del marco de reconocimiento, lo que podría guiar al modelo a aprender mejor la forma y tamaño del objetivo y optimizar el rendimiento de reconocimiento. Experimentos comparativos utilizando el conjunto de datos público de INRIA mostraron que el algoritmo propuesto YOLO-MSP superó a los métodos convencionales de reconocimiento de peatones en precisión y velocidad.
Descripción
Los algoritmos convencionales de reconocimiento de peatones tienen problemas como baja precisión y rendimiento insuficiente en tiempo real. En este estudio, desarrollamos un algoritmo mejorado de reconocimiento de peatones llamado YOLO-MSP (paralelo a escala múltiple) basado en ideas de redes residuales, y mejoramos la arquitectura de la red basada en YOLOv5s. Se utilizaron tres capas de agrupación en paralelo en el módulo MSP para generar características a escala múltiple y mejorar la precisión del modelo asegurando el rendimiento en tiempo real. También se introdujo el módulo Swin Transformer en la red, lo que mejoró la eficiencia del modelo en el procesamiento de imágenes al evitar cálculos globales. Se añadió el mecanismo de atención CBAM (Convolutional Block Attention Module) al módulo C3, y este nuevo módulo se denominó módulo CBAMC3, lo que mejoró la eficiencia del modelo asegurando que fuera ligero. La función de pérdida WMD-IOU (intersección sobre unión multidimensional ponderada) propuesta en este estudio utilizó el cambio de forma entre el marco de reconocimiento y el marco real como un parámetro para calcular la pérdida de la forma del marco de reconocimiento, lo que podría guiar al modelo a aprender mejor la forma y tamaño del objetivo y optimizar el rendimiento de reconocimiento. Experimentos comparativos utilizando el conjunto de datos público de INRIA mostraron que el algoritmo propuesto YOLO-MSP superó a los métodos convencionales de reconocimiento de peatones en precisión y velocidad.