Modelo YOLOv3 basado en Transfer Learning para la detección de objetos densos en carreteras
Autores: Zhu, Chunhua; Liang, Jiarui; Zhou, Fei
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Modelo YOLOv3 basado en Transfer Learning para la detección de objetos densos en carreteras
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Objetos
Detección
YOLOv3
Aprendizaje por transferencia
Vehículo
Precisión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Derivado de la superposición de objetos y el subentrenamiento debido a la escasez de muestras, la detección de objetos densos en la carretera se enfrenta a un rendimiento deficiente en la identificación de objetos y a la incapacidad de reconocer objetos en los bordes. Basado en esto, se ha propuesto un enfoque de YOLOv3 basado en transferencia de aprendizaje para identificar objetos densos en la carretera. En primer lugar, se adopta la estructura de red Darknet-53 para obtener un modelo YOLOv3 preentrenado. Luego, se introduce el entrenamiento por transferencia como la capa de salida para el conjunto de datos especial de 2000 imágenes que contienen vehículos. En el modelo propuesto, se adapta una función aleatoria para inicializar y optimizar los pesos del modelo de entrenamiento por transferencia, que está diseñado por separado del YOLOv3 preentrenado. El clasificador de detección de objetos reemplaza la capa completamente conectada, lo que mejora aún más el efecto de detección. El tamaño reducido del modelo de red puede reducir aún más el tiempo de entrenamiento y detección. Como resultado, puede aplicarse mejor a escenarios reales. Los resultados experimentales demuestran que la precisión de detección de objetos del enfoque presentado es del 87.75% para el conjunto de datos Pascal VOC 2007, que es superior al tradicional YOLOv3 y al YOLOv5 en un 4% y 0.59%, respectivamente. Además, la prueba se realizó utilizando UA-DETRAC, un conjunto de datos público de detección de vehículos en carretera. La precisión de detección de objetos del enfoque presentado alcanza el 79.23% en la detección de imágenes, lo que es un 4.13% mejor que el tradicional YOLOv3, y en comparación con el algoritmo de detección de objetos relativamente nuevo YOLOv5, la precisión de detección es un 1.36% mejor. Además, la velocidad de detección del método YOLOv3 propuesto alcanza 31.2 Fps/s en la detección de imágenes, lo que es 7.6 Fps/s más rápido que el tradicional YOLOv3, y en comparación con el nuevo algoritmo de detección de objetos YOLOv7, la velocidad es 1.5 Fps/s más rápida. El YOLOv3 propuesto realiza 67.36 Bn de operaciones de punto flotante por segundo en la detección de video, lo que es claramente menos que el tradicional YOLOv3 y el algoritmo de detección de objetos más nuevo YOLOv5.
Descripción
Derivado de la superposición de objetos y el subentrenamiento debido a la escasez de muestras, la detección de objetos densos en la carretera se enfrenta a un rendimiento deficiente en la identificación de objetos y a la incapacidad de reconocer objetos en los bordes. Basado en esto, se ha propuesto un enfoque de YOLOv3 basado en transferencia de aprendizaje para identificar objetos densos en la carretera. En primer lugar, se adopta la estructura de red Darknet-53 para obtener un modelo YOLOv3 preentrenado. Luego, se introduce el entrenamiento por transferencia como la capa de salida para el conjunto de datos especial de 2000 imágenes que contienen vehículos. En el modelo propuesto, se adapta una función aleatoria para inicializar y optimizar los pesos del modelo de entrenamiento por transferencia, que está diseñado por separado del YOLOv3 preentrenado. El clasificador de detección de objetos reemplaza la capa completamente conectada, lo que mejora aún más el efecto de detección. El tamaño reducido del modelo de red puede reducir aún más el tiempo de entrenamiento y detección. Como resultado, puede aplicarse mejor a escenarios reales. Los resultados experimentales demuestran que la precisión de detección de objetos del enfoque presentado es del 87.75% para el conjunto de datos Pascal VOC 2007, que es superior al tradicional YOLOv3 y al YOLOv5 en un 4% y 0.59%, respectivamente. Además, la prueba se realizó utilizando UA-DETRAC, un conjunto de datos público de detección de vehículos en carretera. La precisión de detección de objetos del enfoque presentado alcanza el 79.23% en la detección de imágenes, lo que es un 4.13% mejor que el tradicional YOLOv3, y en comparación con el algoritmo de detección de objetos relativamente nuevo YOLOv5, la precisión de detección es un 1.36% mejor. Además, la velocidad de detección del método YOLOv3 propuesto alcanza 31.2 Fps/s en la detección de imágenes, lo que es 7.6 Fps/s más rápido que el tradicional YOLOv3, y en comparación con el nuevo algoritmo de detección de objetos YOLOv7, la velocidad es 1.5 Fps/s más rápida. El YOLOv3 propuesto realiza 67.36 Bn de operaciones de punto flotante por segundo en la detección de video, lo que es claramente menos que el tradicional YOLOv3 y el algoritmo de detección de objetos más nuevo YOLOv5.