Detección de vehículos y peatones basada en YOLOv7-Tiny mejorado
Autores: Liang, Zhen; Wang, Wei; Meng, Ruifeng; Yang, Hongyu; Wang, Jinlei; Gao, He; Li, Biao; Fan, Jungeng
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Detección de vehículos y peatones basada en YOLOv7-Tiny mejorado
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Mejora
Precisión de detección
Algoritmos de detección de objetos
YOLOv7-tiny
Fusión de características
Fusión de Características Multi-Etapa
Compresión de modelo
Poda Basada en Magnitud Adaptativa de Capa
Biblioteca de Poda Torch-Pruning
Implementación de modelo
Modelo V7-tiny-P2-MSFF
NVIDIA Jetson AGX Xavier
MAP@0.5
Velocidad de inferencia
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
Para mejorar la precisión de detección de vehículos y peatones en escenas de tráfico utilizando algoritmos de detección de objetos, este documento presenta modificaciones, compresión e implementación del algoritmo YOLOv7-tiny de una sola etapa. En la sección de mejora del modelo: primero, para abordar el problema de detección perdida de objetos pequeños, se incorpora información de capa de características más superficial en la rama de fusión de características original, formando una cabeza de detección de cuatro escalas; en segundo lugar, se propone un módulo de Fusión de Características Multi-Etapa (MSFF) para integrar completamente información de características superficiales, medias y profundas para extraer información más completa de objetos pequeños. En la sección de compresión del modelo: se combinan el algoritmo de Poda Basado en Magnitud Adaptativa de Capa (LAMP) y la biblioteca Torch-Pruning, estableciendo diferentes tasas de poda para el modelo mejorado. En la sección de implementación del modelo: el modelo V7-tiny-P2-MSFF, podado en un 45% utilizando LAMP, se implementa en la plataforma integrada NVIDIA Jetson AGX Xavier. Los resultados experimentales muestran que el modelo mejorado y podado logra un aumento del 12.3% en mAP@0.5 en comparación con el modelo original, con un volumen de parámetros, volumen de cálculo y tamaño de modelo reducidos en un 76.74%, 7.57% y 70.94%, respectivamente. Además, la velocidad de inferencia de una sola imagen para el modelo podado y cuantificado implementado en Xavier es de 9.5 ms.
Descripción
Para mejorar la precisión de detección de vehículos y peatones en escenas de tráfico utilizando algoritmos de detección de objetos, este documento presenta modificaciones, compresión e implementación del algoritmo YOLOv7-tiny de una sola etapa. En la sección de mejora del modelo: primero, para abordar el problema de detección perdida de objetos pequeños, se incorpora información de capa de características más superficial en la rama de fusión de características original, formando una cabeza de detección de cuatro escalas; en segundo lugar, se propone un módulo de Fusión de Características Multi-Etapa (MSFF) para integrar completamente información de características superficiales, medias y profundas para extraer información más completa de objetos pequeños. En la sección de compresión del modelo: se combinan el algoritmo de Poda Basado en Magnitud Adaptativa de Capa (LAMP) y la biblioteca Torch-Pruning, estableciendo diferentes tasas de poda para el modelo mejorado. En la sección de implementación del modelo: el modelo V7-tiny-P2-MSFF, podado en un 45% utilizando LAMP, se implementa en la plataforma integrada NVIDIA Jetson AGX Xavier. Los resultados experimentales muestran que el modelo mejorado y podado logra un aumento del 12.3% en mAP@0.5 en comparación con el modelo original, con un volumen de parámetros, volumen de cálculo y tamaño de modelo reducidos en un 76.74%, 7.57% y 70.94%, respectivamente. Además, la velocidad de inferencia de una sola imagen para el modelo podado y cuantificado implementado en Xavier es de 9.5 ms.