Clasificación de vehículos basada en imágenes mediante la sinergia de características de paradigmas de aprendizaje supervisado y auto-supervisado
Autores: Ma, Shihan; Yang, Jidong J.
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Clasificación de vehículos basada en imágenes mediante la sinergia de características de paradigmas de aprendizaje supervisado y auto-supervisado
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería General
Palabras clave
Nuevo enfoque
Aprendizaje supervisado
Aprendizaje auto-supervisado
Clasificación de vehículos
Aprendizaje de representación
Data2vec
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
Este documento presenta un enfoque novedoso para aprovechar las características aprendidas tanto de paradigmas supervisados como de auto-supervisados, para mejorar las tareas de clasificación de imágenes, específicamente para la clasificación de vehículos. Dos métodos de aprendizaje auto-supervisado de última generación, DINO y data2vec, fueron evaluados y comparados por su aprendizaje de representaciones de imágenes de vehículos. El primero contrasta vistas locales y globales, mientras que el segundo utiliza predicción enmascarada en representaciones de varias capas. En el segundo caso, se emplea el aprendizaje supervisado para afinar un detector de objetos YOLOR preentrenado para detectar ruedas de vehículos, de las cuales se obtienen características posicionales de ruedas definitivas. Las representaciones aprendidas de estos métodos de aprendizaje auto-supervisado se combinaron con las características posicionales de las ruedas para la tarea de clasificación de vehículos. Específicamente, se utilizó una estrategia de enmascaramiento de ruedas aleatorias para afinar las representaciones previamente aprendidas en armonía con las características posicionales de las ruedas durante el entrenamiento del clasificador. Nuestros experimentos muestran que las representaciones destiladas de data2vec, consistentes con nuestra estrategia de enmascaramiento de ruedas, superaron a la contraparte de DINO, lo que resultó en una precisión de clasificación Top-1 celebrada del 97,2% para clasificar las 13 clases de vehículos definidas por la Administración Federal de Carreteras.
Descripción
Este documento presenta un enfoque novedoso para aprovechar las características aprendidas tanto de paradigmas supervisados como de auto-supervisados, para mejorar las tareas de clasificación de imágenes, específicamente para la clasificación de vehículos. Dos métodos de aprendizaje auto-supervisado de última generación, DINO y data2vec, fueron evaluados y comparados por su aprendizaje de representaciones de imágenes de vehículos. El primero contrasta vistas locales y globales, mientras que el segundo utiliza predicción enmascarada en representaciones de varias capas. En el segundo caso, se emplea el aprendizaje supervisado para afinar un detector de objetos YOLOR preentrenado para detectar ruedas de vehículos, de las cuales se obtienen características posicionales de ruedas definitivas. Las representaciones aprendidas de estos métodos de aprendizaje auto-supervisado se combinaron con las características posicionales de las ruedas para la tarea de clasificación de vehículos. Específicamente, se utilizó una estrategia de enmascaramiento de ruedas aleatorias para afinar las representaciones previamente aprendidas en armonía con las características posicionales de las ruedas durante el entrenamiento del clasificador. Nuestros experimentos muestran que las representaciones destiladas de data2vec, consistentes con nuestra estrategia de enmascaramiento de ruedas, superaron a la contraparte de DINO, lo que resultó en una precisión de clasificación Top-1 celebrada del 97,2% para clasificar las 13 clases de vehículos definidas por la Administración Federal de Carreteras.