CPB-YOLOv8: Un Detector de Señales de Tráfico Multi-escala Mejorado para Entornos Viales Complejos
Autores: Zhao, Wei; Li, Lanlan; Gong, Xin
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
CPB-YOLOv8: Un Detector de Señales de Tráfico Multi-escala Mejorado para Entornos Viales Complejos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Detección de señales de tráfico
Sistemas de transporte inteligentes
CPB-YOLOv8
Marco de detección a múltiples escalas
Arquitectura YOLOv8
Detección de objetivos pequeños
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La detección de señales de tráfico es críticamente importante para los sistemas de transporte inteligente, sin embargo, desafíos persistentes como la variación a múltiples escalas y la interferencia de fondos complejos degradan severamente la precisión de detección y el rendimiento en tiempo real. Para abordar estas limitaciones, este estudio presenta CPB-YOLOv8, un marco de detección avanzada a múltiples escalas basado en la arquitectura YOLOv8. Se incorpora un Bloque de Transformador Parcialmente Particionado entre Etapas (CSP-PTB) en la etapa de extracción de características para preservar la información semántica durante el muestreo descendente mientras se mejora la representación de características globales. Para la fusión de características, una pirámide de características bidireccional de cuatro niveles BiFPN integrada con una capa de detección P2 mejora significativamente la capacidad de detección de objetivos pequeños. Se logra una mejora adicional a través de una función de pérdida optimizada que equilibra la localización objetiva a múltiples escalas. Se realizaron evaluaciones exhaustivas en el TT100K, el CCTSDB y un conjunto de datos de imágenes de carreteras de múltiples escenarios personalizado que captura entornos urbanos y suburbanos a una resolución de 1920 x 1080. Los resultados demuestran un rendimiento convincente: en TT100K, CPB-YOLOv8 logró un 90.73% mAP@0.5 con un tamaño de modelo de 12.5 MB, superando la línea base de YOLOv8s en 3.94 puntos porcentuales y logrando un 6.43% más de recuperación de objetivos pequeños. En CCTSDB, alcanzó un rendimiento casi de saturación del 99.21% mAP@0.5. Crucialmente, el modelo demostró una robustez excepcional en diversas condiciones ambientales. Un análisis riguroso en subconjuntos particionados de CCTSDB basado en el clima y la iluminación, junto con la validación utilizando un conjunto de datos separado recopilado de forma independiente reservado únicamente para inferencia, confirmó una fuerte adaptabilidad a los cambios de distribución en el mundo real y a escenarios de baja visibilidad. La validación entre conjuntos de datos y las comparaciones visuales respaldaron aún más la robustez del modelo y su efectiva supresión de la interferencia de fondo.
Descripción
La detección de señales de tráfico es críticamente importante para los sistemas de transporte inteligente, sin embargo, desafíos persistentes como la variación a múltiples escalas y la interferencia de fondos complejos degradan severamente la precisión de detección y el rendimiento en tiempo real. Para abordar estas limitaciones, este estudio presenta CPB-YOLOv8, un marco de detección avanzada a múltiples escalas basado en la arquitectura YOLOv8. Se incorpora un Bloque de Transformador Parcialmente Particionado entre Etapas (CSP-PTB) en la etapa de extracción de características para preservar la información semántica durante el muestreo descendente mientras se mejora la representación de características globales. Para la fusión de características, una pirámide de características bidireccional de cuatro niveles BiFPN integrada con una capa de detección P2 mejora significativamente la capacidad de detección de objetivos pequeños. Se logra una mejora adicional a través de una función de pérdida optimizada que equilibra la localización objetiva a múltiples escalas. Se realizaron evaluaciones exhaustivas en el TT100K, el CCTSDB y un conjunto de datos de imágenes de carreteras de múltiples escenarios personalizado que captura entornos urbanos y suburbanos a una resolución de 1920 x 1080. Los resultados demuestran un rendimiento convincente: en TT100K, CPB-YOLOv8 logró un 90.73% mAP@0.5 con un tamaño de modelo de 12.5 MB, superando la línea base de YOLOv8s en 3.94 puntos porcentuales y logrando un 6.43% más de recuperación de objetivos pequeños. En CCTSDB, alcanzó un rendimiento casi de saturación del 99.21% mAP@0.5. Crucialmente, el modelo demostró una robustez excepcional en diversas condiciones ambientales. Un análisis riguroso en subconjuntos particionados de CCTSDB basado en el clima y la iluminación, junto con la validación utilizando un conjunto de datos separado recopilado de forma independiente reservado únicamente para inferencia, confirmó una fuerte adaptabilidad a los cambios de distribución en el mundo real y a escenarios de baja visibilidad. La validación entre conjuntos de datos y las comparaciones visuales respaldaron aún más la robustez del modelo y su efectiva supresión de la interferencia de fondo.