Detección y clasificación de vehículos en tiempo real basada en aprendizaje profundo y mediciones de exposición de código píxel a píxel
Autores: Kwan, Chiman; Gribben, David; Chou, Bryan; Budavari, Bence; Larkin, Jude; Rangamani, Akshay; Tran, Trac; Zhang, Jack; Etienne-Cummings, Ralph
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Detección y clasificación de vehículos en tiempo real basada en aprendizaje profundo y mediciones de exposición de código píxel a píxel
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Ventaja
Compresión sensorial
Ancho de banda
Potencia de procesamiento
Detección de objetos
Clasificación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
Una ventaja clave de la sensación compresiva es que solo se transmite o guarda una pequeña cantidad de los datos de video crudos. Esto es extremadamente importante en aplicaciones con restricciones de ancho de banda. Además, en algunos escenarios, el dispositivo de procesamiento local puede no tener suficiente potencia de procesamiento para manejar la detección y clasificación de objetos, por lo que las tareas de procesamiento pesado deben realizarse en una ubicación remota. Los esquemas convencionales de sensación compresiva requieren que los datos comprimidos se reconstruyan primero antes de que pueda comenzar cualquier procesamiento posterior. Esto no solo consume tiempo, sino que también puede perder información importante en el proceso. En este documento, presentamos un marco en tiempo real para procesar mediciones compresivas directamente sin ninguna reconstrucción de imagen. Se adopta un tipo especial de medición compresiva conocida como exposición codificada píxel por píxel (PCE) en nuestro marco. PCE condensa múltiples fotogramas en un solo fotograma. Los píxeles individuales también pueden tener diferentes tiempos de exposición para permitir rangos dinámicos altos. Una herramienta de aprendizaje profundo conocida como You Only Look Once (YOLO) se ha utilizado en nuestro sistema en tiempo real para la detección y clasificación de objetos. Experimentos extensos mostraron que el marco en tiempo real propuesto es factible y puede lograr un rendimiento decente en la detección y clasificación.
Descripción
Una ventaja clave de la sensación compresiva es que solo se transmite o guarda una pequeña cantidad de los datos de video crudos. Esto es extremadamente importante en aplicaciones con restricciones de ancho de banda. Además, en algunos escenarios, el dispositivo de procesamiento local puede no tener suficiente potencia de procesamiento para manejar la detección y clasificación de objetos, por lo que las tareas de procesamiento pesado deben realizarse en una ubicación remota. Los esquemas convencionales de sensación compresiva requieren que los datos comprimidos se reconstruyan primero antes de que pueda comenzar cualquier procesamiento posterior. Esto no solo consume tiempo, sino que también puede perder información importante en el proceso. En este documento, presentamos un marco en tiempo real para procesar mediciones compresivas directamente sin ninguna reconstrucción de imagen. Se adopta un tipo especial de medición compresiva conocida como exposición codificada píxel por píxel (PCE) en nuestro marco. PCE condensa múltiples fotogramas en un solo fotograma. Los píxeles individuales también pueden tener diferentes tiempos de exposición para permitir rangos dinámicos altos. Una herramienta de aprendizaje profundo conocida como You Only Look Once (YOLO) se ha utilizado en nuestro sistema en tiempo real para la detección y clasificación de objetos. Experimentos extensos mostraron que el marco en tiempo real propuesto es factible y puede lograr un rendimiento decente en la detección y clasificación.