Red de detección de objetos basada en apilamiento de módulos y mecanismo de atención
Autores: Dou, Xinke; Wang, Ting; Shao, Shiliang; Cao, Xianqing
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Red de detección de objetos basada en apilamiento de módulos y mecanismo de atención
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Redes neuronales convolucionales
YOLOv5-L
PP-LCNet
Módulo de convolución separable profunda
Operaciones de convolución innecesarias
Equipos informáticos de bajo rendimiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
Actualmente, las aplicaciones informáticas visuales basadas en redes neuronales convolucionales están desarrollándose rápidamente. Sin embargo, persisten varios problemas: (1) se necesita equipo de procesamiento gráfico de alta calidad y (2) el modelo de red entrenada tiene varias operaciones de convolución innecesarias. Estos problemas resultan en una red de detección de objetivos de una sola etapa que a menudo requiere potencia de cálculo innecesaria y es difícil de aplicar a equipos con recursos de cálculo insuficientes. Para resolver estos problemas, se propone una estructura de red YOLOv5-L (YOLOv5 Lightweight) basada en YOLOv5. Esta red se mejora utilizando YOLOv5. Primero, para mejorar la velocidad de inferencia del detector en la CPU, se emplea el PP-LCNet (PaddlePaddle-Lightweight CPU Net) como red de base. En segundo lugar, se elimina el módulo de enfoque y se reemplaza el módulo de convolución final en la red principal por un módulo de convolución profunda separable, lo que elimina operaciones redundantes y reduce la cantidad de cálculos. Los resultados experimentales muestran que YOLOv5-L permite una reducción del 48% en los parámetros del modelo y en los cálculos en comparación con YOLOv5, un aumento del 35% en la velocidad de operación y una reducción de menos del 2% en la precisión, lo cual es significativo en el entorno de equipos informáticos de bajo rendimiento.
Descripción
Actualmente, las aplicaciones informáticas visuales basadas en redes neuronales convolucionales están desarrollándose rápidamente. Sin embargo, persisten varios problemas: (1) se necesita equipo de procesamiento gráfico de alta calidad y (2) el modelo de red entrenada tiene varias operaciones de convolución innecesarias. Estos problemas resultan en una red de detección de objetivos de una sola etapa que a menudo requiere potencia de cálculo innecesaria y es difícil de aplicar a equipos con recursos de cálculo insuficientes. Para resolver estos problemas, se propone una estructura de red YOLOv5-L (YOLOv5 Lightweight) basada en YOLOv5. Esta red se mejora utilizando YOLOv5. Primero, para mejorar la velocidad de inferencia del detector en la CPU, se emplea el PP-LCNet (PaddlePaddle-Lightweight CPU Net) como red de base. En segundo lugar, se elimina el módulo de enfoque y se reemplaza el módulo de convolución final en la red principal por un módulo de convolución profunda separable, lo que elimina operaciones redundantes y reduce la cantidad de cálculos. Los resultados experimentales muestran que YOLOv5-L permite una reducción del 48% en los parámetros del modelo y en los cálculos en comparación con YOLOv5, un aumento del 35% en la velocidad de operación y una reducción de menos del 2% en la precisión, lo cual es significativo en el entorno de equipos informáticos de bajo rendimiento.