Biga-yolo: una red de detección de objetos ligera basada en yolo v5 para conducción autónoma
Autores: Liu, Jun; Cai, Qiqin; Zou, Fumin; Zhu, Yintian; Liao, Lyuchao; Guo, Feng
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Biga-yolo: una red de detección de objetos ligera basada en yolo v5 para conducción autónoma
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Detección de objetos
Conducción autónoma
Modelo de red
Modelo ligero
BiGA-YOLO
Capacidades de rendimiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 64
Citaciones: Sin citaciones
La detección de objetos en escenarios de conducción autónoma se ha convertido en una tarea popular en los últimos años. Debido al movimiento de alta velocidad de los vehículos y a los complejos cambios en el entorno circundante, es necesario detectar objetos de diferentes escalas, lo que impone altas exigencias sobre el rendimiento del modelo de red. Además, diferentes dispositivos de conducción tienen capacidades de rendimiento variables, y se necesita un modelo ligero para garantizar la operación estable de dispositivos con potencia de cálculo limitada. Para abordar estos desafíos, proponemos una red ligera llamada BiGA-YOLO basada en YOLOv5. Diseñamos el módulo Ghost-Hardswish Conv para simplificar las operaciones de convolución e incorporamos información de coordenadas espaciales en los mapas de características utilizando Atención de Coordenadas. También reemplazamos la estructura PANet con la estructura BiFPN para mejorar la capacidad de expresión de las características a través de diferentes pesos durante el proceso de fusión de mapas de características de múltiples escalas. Finalmente, realizamos experimentos extensos en el conjunto de datos KITTI, y nuestro BiGA-YOLO logró un mAP@0.5 del 92.2% y un mAP@0.5:0.95 del 68.3%. En comparación con el modelo base YOLOv5, nuestro modelo propuesto logró mejoras del 1.9% y 4.7% en mAP@0.5 y mAP@0.5:0.95, respectivamente, al tiempo que reducía el tamaño del modelo en un 15.7% y el costo computacional en un 16%. La velocidad de detección también se incrementó en 6.3 FPS. A través del análisis y discusión de los resultados experimentales, demostramos que nuestro modelo propuesto es superior, logrando un equilibrio entre la precisión de detección, el tamaño del modelo y la velocidad de detección.
Descripción
La detección de objetos en escenarios de conducción autónoma se ha convertido en una tarea popular en los últimos años. Debido al movimiento de alta velocidad de los vehículos y a los complejos cambios en el entorno circundante, es necesario detectar objetos de diferentes escalas, lo que impone altas exigencias sobre el rendimiento del modelo de red. Además, diferentes dispositivos de conducción tienen capacidades de rendimiento variables, y se necesita un modelo ligero para garantizar la operación estable de dispositivos con potencia de cálculo limitada. Para abordar estos desafíos, proponemos una red ligera llamada BiGA-YOLO basada en YOLOv5. Diseñamos el módulo Ghost-Hardswish Conv para simplificar las operaciones de convolución e incorporamos información de coordenadas espaciales en los mapas de características utilizando Atención de Coordenadas. También reemplazamos la estructura PANet con la estructura BiFPN para mejorar la capacidad de expresión de las características a través de diferentes pesos durante el proceso de fusión de mapas de características de múltiples escalas. Finalmente, realizamos experimentos extensos en el conjunto de datos KITTI, y nuestro BiGA-YOLO logró un mAP@0.5 del 92.2% y un mAP@0.5:0.95 del 68.3%. En comparación con el modelo base YOLOv5, nuestro modelo propuesto logró mejoras del 1.9% y 4.7% en mAP@0.5 y mAP@0.5:0.95, respectivamente, al tiempo que reducía el tamaño del modelo en un 15.7% y el costo computacional en un 16%. La velocidad de detección también se incrementó en 6.3 FPS. A través del análisis y discusión de los resultados experimentales, demostramos que nuestro modelo propuesto es superior, logrando un equilibrio entre la precisión de detección, el tamaño del modelo y la velocidad de detección.