StarCAN-PFD: una red de detección de características a múltiples escalas eficiente y simplificada para objetos pequeños en escenarios complejos
Autores: Chai, Zongxuan; Zheng, Tingting; Lu, Feixiang
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
StarCAN-PFD: una red de detección de características a múltiples escalas eficiente y simplificada para objetos pequeños en escenarios complejos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Detección de objetos
Aplicaciones de señales de tráfico
Objetos pequeños
Fondos complejos
Muestras borrosas
Variaciones a múltiples escalas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 45
Citaciones: Sin citaciones
La detección de objetos pequeños en aplicaciones de señales de tráfico a menudo enfrenta desafíos como fondos complejos, muestras borrosas y variaciones a múltiples escalas. Las soluciones existentes tienden a complicar los algoritmos. En este estudio, diseñamos una red de algoritmos eficiente y simple llamada StarCAN-PFD, basada en el marco YOLOv8 de una sola etapa, para reconocer con precisión objetos pequeños en escenarios complejos. Propusimos la red de extracción de características StarCAN, que se mejoró con la Atención de Anclaje de Contexto (CAA). Diseñamos la Red de Enfoque y Difusión en Pirámide (PFDNet) para abordar la pérdida de información a múltiples escalas y desarrollamos el módulo DETalle Mejorado Conv Detectar Compartido (DESDetect) para mejorar el reconocimiento de muestras complejas manteniendo la red ligera. Los experimentos en el conjunto de datos CCTSDB validaron la efectividad de cada módulo. En comparación con YOLOv8, nuestro algoritmo mejoró el mAP@0.5 en un 4%, redujo el tamaño del modelo a menos de la mitad y demostró un mejor rendimiento en diferentes conjuntos de datos de señales de tráfico. Sobresale en la detección de pequeños objetivos de señales de tráfico en escenas complejas, incluidas muestras desafiantes como borrosas, de poca luz nocturna, ocultas y sobreexpuestas, mostrando una fuerte capacidad de generalización.
Descripción
La detección de objetos pequeños en aplicaciones de señales de tráfico a menudo enfrenta desafíos como fondos complejos, muestras borrosas y variaciones a múltiples escalas. Las soluciones existentes tienden a complicar los algoritmos. En este estudio, diseñamos una red de algoritmos eficiente y simple llamada StarCAN-PFD, basada en el marco YOLOv8 de una sola etapa, para reconocer con precisión objetos pequeños en escenarios complejos. Propusimos la red de extracción de características StarCAN, que se mejoró con la Atención de Anclaje de Contexto (CAA). Diseñamos la Red de Enfoque y Difusión en Pirámide (PFDNet) para abordar la pérdida de información a múltiples escalas y desarrollamos el módulo DETalle Mejorado Conv Detectar Compartido (DESDetect) para mejorar el reconocimiento de muestras complejas manteniendo la red ligera. Los experimentos en el conjunto de datos CCTSDB validaron la efectividad de cada módulo. En comparación con YOLOv8, nuestro algoritmo mejoró el mAP@0.5 en un 4%, redujo el tamaño del modelo a menos de la mitad y demostró un mejor rendimiento en diferentes conjuntos de datos de señales de tráfico. Sobresale en la detección de pequeños objetivos de señales de tráfico en escenas complejas, incluidas muestras desafiantes como borrosas, de poca luz nocturna, ocultas y sobreexpuestas, mostrando una fuerte capacidad de generalización.