Medición de volúmenes de tráfico utilizando un autoencoder sin necesidad de etiquetar imágenes con etiquetas
Autores: Roh, Seungbin; Shin, Johyun; Sohn, Keemin
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Medición de volúmenes de tráfico utilizando un autoencoder sin necesidad de etiquetar imágenes con etiquetas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Tecnologías de visión
Volumen de tráfico
Algoritmos de detección de objetos
Seguimiento
Vehículos
Autoencoder
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
Casi todas las tecnologías de visión que se utilizan para medir el volumen de tráfico utilizan un procedimiento de dos pasos que implica el seguimiento y la detección. Los algoritmos de detección de objetos como YOLO y Fast-RCNN se han aplicado con éxito a la detección de vehículos. El seguimiento de los vehículos requiere un algoritmo adicional que pueda rastrear los vehículos que aparecen en un fotograma de video anterior hasta su aparición en un fotograma posterior. Este algoritmo de dos pasos prevalece en el campo pero requiere recursos de computación sustanciales para el entrenamiento, la prueba y la evaluación. El estudio actual ideó un algoritmo más simple basado en un autoencoder que no requiere datos etiquetados para el entrenamiento. Un autoencoder fue entrenado en las intensidades de píxeles de una línea virtual colocada en imágenes de manera no supervisada. El último nodo oculto de la porción de codificación anterior del autoencoder genera una señal escalar que se puede utilizar para juzgar si un vehículo está pasando. Se utilizó una red generativa adversarial cíclica consistente (CycleGAN) para transformar una foto de entrada original de imágenes de vehículos y fondos complejos en una imagen de entrada de ilustración simple que mejora el rendimiento del autoencoder en juzgar la presencia de un vehículo. El modelo propuesto es mucho más ligero y rápido que un modelo basado en YOLO, y la precisión del modelo propuesto es equivalente o mejor que la de un modelo basado en YOLO. En la medición de volúmenes de tráfico, el enfoque propuesto resultó ser robusto en términos de precisión y eficiencia.
Descripción
Casi todas las tecnologías de visión que se utilizan para medir el volumen de tráfico utilizan un procedimiento de dos pasos que implica el seguimiento y la detección. Los algoritmos de detección de objetos como YOLO y Fast-RCNN se han aplicado con éxito a la detección de vehículos. El seguimiento de los vehículos requiere un algoritmo adicional que pueda rastrear los vehículos que aparecen en un fotograma de video anterior hasta su aparición en un fotograma posterior. Este algoritmo de dos pasos prevalece en el campo pero requiere recursos de computación sustanciales para el entrenamiento, la prueba y la evaluación. El estudio actual ideó un algoritmo más simple basado en un autoencoder que no requiere datos etiquetados para el entrenamiento. Un autoencoder fue entrenado en las intensidades de píxeles de una línea virtual colocada en imágenes de manera no supervisada. El último nodo oculto de la porción de codificación anterior del autoencoder genera una señal escalar que se puede utilizar para juzgar si un vehículo está pasando. Se utilizó una red generativa adversarial cíclica consistente (CycleGAN) para transformar una foto de entrada original de imágenes de vehículos y fondos complejos en una imagen de entrada de ilustración simple que mejora el rendimiento del autoencoder en juzgar la presencia de un vehículo. El modelo propuesto es mucho más ligero y rápido que un modelo basado en YOLO, y la precisión del modelo propuesto es equivalente o mejor que la de un modelo basado en YOLO. En la medición de volúmenes de tráfico, el enfoque propuesto resultó ser robusto en términos de precisión y eficiencia.