Mejorando el rendimiento de yolv8 en escenarios de tráfico complejos: diseño de optimización para manejar dependencias a larga distancia y relaciones de características complejas
Autores: Li, Bingyu; Meng, Qiao; Li, Xin; Wang, Zhijie; Liu, Xin; Kong, Siyuan
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Mejorando el rendimiento de yolv8 en escenarios de tráfico complejos: diseño de optimización para manejar dependencias a larga distancia y relaciones de características complejas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aprendizaje profundo
Visión por computadora
Detección de objetivos vehiculares
YOLOv8
Estrategias de optimización
Escenarios de tráfico
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 46
Citaciones: Sin citaciones
En los últimos años, el campo del aprendizaje profundo y la visión por computadora se ha centrado cada vez más en el problema de la detección de objetivos de vehículos, convirtiéndose en la vanguardia de muchas innovaciones tecnológicas. YOLOv8, como un modelo eficiente de detección de objetivos de vehículos, ha logrado buenos resultados en muchos escenarios. Sin embargo, cuando se enfrenta a escenarios de tráfico complejos, como objetivos ocultos, detección de objetivos pequeños, cambios en la iluminación y condiciones climáticas variables, YOLOv8 aún tiene una precisión de detección y robustez insuficientes. Para abordar estos problemas, este documento profundiza en las estrategias de optimización de YOLOv8 en el campo de la detección de objetivos de vehículos, centrándose en el módulo EMA en la parte principal y reemplazando el módulo SPPF original con tecnología de modulación focal, todo lo cual mejoró efectivamente el rendimiento del modelo. Al mismo tiempo, las modificaciones en la parte superior se abordaron con precaución para evitar interferencias innecesarias con el diseño original. El experimento utilizó el conjunto de datos UA-DETRAC, que contiene una variedad de escenarios de tráfico, una amplia variedad de tipos de vehículos y entornos dinámicos complejos, lo que lo hace adecuado para evaluar y validar el rendimiento de los sistemas de monitoreo de tráfico. Se utilizó el método de validación cruzada de 5 pliegues para garantizar la fiabilidad y exhaustividad de los resultados de la evaluación. Los resultados finales mostraron que la tasa de precisión del modelo mejorado aumentó de 0.859 a 0.961, la tasa de recuperación de 0.83 a 0.908 y el mAP50 de 0.881 a 0.962. Mientras tanto, el modelo YOLOv8 optimizado demostró una fuerte robustez en términos de precisión de detección y capacidad para adaptarse a entornos complejos.
Descripción
En los últimos años, el campo del aprendizaje profundo y la visión por computadora se ha centrado cada vez más en el problema de la detección de objetivos de vehículos, convirtiéndose en la vanguardia de muchas innovaciones tecnológicas. YOLOv8, como un modelo eficiente de detección de objetivos de vehículos, ha logrado buenos resultados en muchos escenarios. Sin embargo, cuando se enfrenta a escenarios de tráfico complejos, como objetivos ocultos, detección de objetivos pequeños, cambios en la iluminación y condiciones climáticas variables, YOLOv8 aún tiene una precisión de detección y robustez insuficientes. Para abordar estos problemas, este documento profundiza en las estrategias de optimización de YOLOv8 en el campo de la detección de objetivos de vehículos, centrándose en el módulo EMA en la parte principal y reemplazando el módulo SPPF original con tecnología de modulación focal, todo lo cual mejoró efectivamente el rendimiento del modelo. Al mismo tiempo, las modificaciones en la parte superior se abordaron con precaución para evitar interferencias innecesarias con el diseño original. El experimento utilizó el conjunto de datos UA-DETRAC, que contiene una variedad de escenarios de tráfico, una amplia variedad de tipos de vehículos y entornos dinámicos complejos, lo que lo hace adecuado para evaluar y validar el rendimiento de los sistemas de monitoreo de tráfico. Se utilizó el método de validación cruzada de 5 pliegues para garantizar la fiabilidad y exhaustividad de los resultados de la evaluación. Los resultados finales mostraron que la tasa de precisión del modelo mejorado aumentó de 0.859 a 0.961, la tasa de recuperación de 0.83 a 0.908 y el mAP50 de 0.881 a 0.962. Mientras tanto, el modelo YOLOv8 optimizado demostró una fuerte robustez en términos de precisión de detección y capacidad para adaptarse a entornos complejos.