Múltiples mecanismos para fortalecer la capacidad de yOLOv5s para la identificación en tiempo real del tipo de vehículo
Autores: Luo, Qiang; Wang, Junfan; Gao, Mingyu; He, Zhiwei; Yang, Yuxiang; Zhou, Hongtao
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Múltiples mecanismos para fortalecer la capacidad de yOLOv5s para la identificación en tiempo real del tipo de vehículo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Tipo de vehículo
Detección de objetos
Redes ligeras
YOLOv5s
Módulo de fusión convolucional
Red de atención
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
Identificar el tipo de vehículo en la carretera es una tarea desafiante, especialmente en el entorno natural con todas sus complejidades, de modo que la arquitectura tradicional para la detección de objetos requiere una cantidad excesivamente grande de cálculos. Redes ligeras como MobileNet son rápidas pero no pueden satisfacer los requisitos relacionados con el rendimiento de esta tarea. Mejorar el rendimiento relacionado con la detección de redes pequeñas es, por lo tanto, un desafío pendiente. En este documento, utilizamos YOLOv5s como red principal para proponer un módulo de fusión convolucional a gran escala llamado red parcial de etapa cruzada fantasma (G_CSP), que puede integrar información a gran escala de diferentes mapas de características para identificar vehículos en la carretera. Utilizamos el módulo de red de atención triple convolucional (C_TA) para extraer información basada en la atención de diferentes dimensiones. También optimizamos el módulo original de agrupamiento piramidal espacial rápido (SPPF) y utilizamos la convolución dilatada para aumentar la capacidad de la red para extraer información. El módulo optimizado se llama DSPPF. Los resultados de experimentos extensos en los conjuntos de datos bdd100K, VOC2012 + 2007 y VOC2019 mostraron que la red YOLOv5s mejorada tiene un buen rendimiento y puede utilizarse en dispositivos móviles en tiempo real.
Descripción
Identificar el tipo de vehículo en la carretera es una tarea desafiante, especialmente en el entorno natural con todas sus complejidades, de modo que la arquitectura tradicional para la detección de objetos requiere una cantidad excesivamente grande de cálculos. Redes ligeras como MobileNet son rápidas pero no pueden satisfacer los requisitos relacionados con el rendimiento de esta tarea. Mejorar el rendimiento relacionado con la detección de redes pequeñas es, por lo tanto, un desafío pendiente. En este documento, utilizamos YOLOv5s como red principal para proponer un módulo de fusión convolucional a gran escala llamado red parcial de etapa cruzada fantasma (G_CSP), que puede integrar información a gran escala de diferentes mapas de características para identificar vehículos en la carretera. Utilizamos el módulo de red de atención triple convolucional (C_TA) para extraer información basada en la atención de diferentes dimensiones. También optimizamos el módulo original de agrupamiento piramidal espacial rápido (SPPF) y utilizamos la convolución dilatada para aumentar la capacidad de la red para extraer información. El módulo optimizado se llama DSPPF. Los resultados de experimentos extensos en los conjuntos de datos bdd100K, VOC2012 + 2007 y VOC2019 mostraron que la red YOLOv5s mejorada tiene un buen rendimiento y puede utilizarse en dispositivos móviles en tiempo real.