logo móvil
Contáctanos

Detección de vehículos y peatones basada en YOLOv7-Tiny mejorado

Autores: Liang, Zhen; Wang, Wei; Meng, Ruifeng; Yang, Hongyu; Wang, Jinlei; Gao, He; Li, Biao; Fan, Jungeng

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Detección de vehículos y peatones basada en YOLOv7-Tiny mejorado


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Mejora
Precisión de detección
Algoritmos de detección de objetos
YOLOv7-tiny
Fusión de características
Fusión de Características Multi-Etapa
Compresión de modelo
Poda Basada en Magnitud Adaptativa de Capa
Biblioteca de Poda Torch-Pruning
Implementación de modelo
Modelo V7-tiny-P2-MSFF
NVIDIA Jetson AGX Xavier
MAP@0.5
Velocidad de inferencia

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 24

Citaciones: Sin citaciones


Descripción
Para mejorar la precisión de detección de vehículos y peatones en escenas de tráfico utilizando algoritmos de detección de objetos, este documento presenta modificaciones, compresión e implementación del algoritmo YOLOv7-tiny de una sola etapa. En la sección de mejora del modelo: primero, para abordar el problema de detección perdida de objetos pequeños, se incorpora información de capa de características más superficial en la rama de fusión de características original, formando una cabeza de detección de cuatro escalas; en segundo lugar, se propone un módulo de Fusión de Características Multi-Etapa (MSFF) para integrar completamente información de características superficiales, medias y profundas para extraer información más completa de objetos pequeños. En la sección de compresión del modelo: se combinan el algoritmo de Poda Basado en Magnitud Adaptativa de Capa (LAMP) y la biblioteca Torch-Pruning, estableciendo diferentes tasas de poda para el modelo mejorado. En la sección de implementación del modelo: el modelo V7-tiny-P2-MSFF, podado en un 45% utilizando LAMP, se implementa en la plataforma integrada NVIDIA Jetson AGX Xavier. Los resultados experimentales muestran que el modelo mejorado y podado logra un aumento del 12.3% en mAP@0.5 en comparación con el modelo original, con un volumen de parámetros, volumen de cálculo y tamaño de modelo reducidos en un 76.74%, 7.57% y 70.94%, respectivamente. Además, la velocidad de inferencia de una sola imagen para el modelo podado y cuantificado implementado en Xavier es de 9.5 ms.

Otros recursos que podrían interesarte

Temas Virtualpro