Detección de accidentes de tráfico utilizando sustracción de fondo y codificador CNN-Transformador decodificador en fotogramas de video
Autores: Zhang, Yihang; Sung, Yunsick
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Detección de accidentes de tráfico utilizando sustracción de fondo y codificador CNN-Transformador decodificador en fotogramas de video
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Inteligencia artificial
Detección de accidentes de tráfico
Red neuronal convolucional
Red neuronal recurrente
Interferencia de fondo
YOLOv5
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
La inteligencia artificial juega un papel significativo en la detección de accidentes de tráfico. Los accidentes de tráfico involucran una cascada de eventos inadvertidos, lo que hace que los enfoques de detección tradicionales sean desafiantes. Por ejemplo, los enfoques basados en Redes Neuronales Convolucionales (CNN) no pueden analizar las relaciones temporales entre objetos, y los enfoques basados en Redes Neuronales Recurrentes (RNN) sufren de velocidades de procesamiento lentas y no pueden detectar accidentes de tráfico simultáneamente en múltiples fotogramas. Además, estas redes desestiman la interferencia de fondo en los fotogramas de video de entrada. Este documento propone un marco que comienza restando el fondo basado en You Only Look Once (YOLOv5), lo que reduce adaptativamente la interferencia de fondo al detectar objetos. Posteriormente, el codificador CNN y el decodificador Transformer se combinan en un modelo de extremo a extremo para extraer las características espaciales y temporales entre diferentes puntos temporales, permitiendo un análisis paralelo entre los fotogramas de video de entrada. El marco propuesto fue evaluado en el Conjunto de Datos de Accidentes de Automóviles a través de una serie de experimentos de comparación y ablación. Nuestro marco se comparó con tres modelos de detección de accidentes para evaluar su efectividad, y el marco propuesto demostró una precisión superior de aproximadamente el 96%. Los resultados de los experimentos de ablación indican que cuando la sustracción de fondo no se incorporó en el marco propuesto, los valores de todos los indicadores de evaluación disminuyeron aproximadamente un 3%.
Descripción
La inteligencia artificial juega un papel significativo en la detección de accidentes de tráfico. Los accidentes de tráfico involucran una cascada de eventos inadvertidos, lo que hace que los enfoques de detección tradicionales sean desafiantes. Por ejemplo, los enfoques basados en Redes Neuronales Convolucionales (CNN) no pueden analizar las relaciones temporales entre objetos, y los enfoques basados en Redes Neuronales Recurrentes (RNN) sufren de velocidades de procesamiento lentas y no pueden detectar accidentes de tráfico simultáneamente en múltiples fotogramas. Además, estas redes desestiman la interferencia de fondo en los fotogramas de video de entrada. Este documento propone un marco que comienza restando el fondo basado en You Only Look Once (YOLOv5), lo que reduce adaptativamente la interferencia de fondo al detectar objetos. Posteriormente, el codificador CNN y el decodificador Transformer se combinan en un modelo de extremo a extremo para extraer las características espaciales y temporales entre diferentes puntos temporales, permitiendo un análisis paralelo entre los fotogramas de video de entrada. El marco propuesto fue evaluado en el Conjunto de Datos de Accidentes de Automóviles a través de una serie de experimentos de comparación y ablación. Nuestro marco se comparó con tres modelos de detección de accidentes para evaluar su efectividad, y el marco propuesto demostró una precisión superior de aproximadamente el 96%. Los resultados de los experimentos de ablación indican que cuando la sustracción de fondo no se incorporó en el marco propuesto, los valores de todos los indicadores de evaluación disminuyeron aproximadamente un 3%.