Aprendizaje incremental de pocos disparos semi-supervisado con análisis de componentes principales k-probabilístico
Autores: Han, Ke; Barbu, Adrian
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Aprendizaje incremental de pocos disparos semi-supervisado con análisis de componentes principales k-probabilístico
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Nuevo método
Semi-supervisado
Pocos disparos
Aprendizaje incremental
PCA probabilístico
Conjuntos de datos a gran escala
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
Este documento presenta un método novedoso para el Aprendizaje Incremental de Clases de Pocas Muestras Semi-Supervisado (SSFSCIL) que no muestra prácticamente ningún olvido catastrófico. El método utiliza un extractor de características genérico que fue preentrenado sin supervisión en un gran conjunto de datos de imágenes, y un clasificador basado en un modelo de Análisis de Componentes Principales Probabilístico (PPCA) para cada clase en lugar de la capa completamente conectada estándar generalmente empleada como la cabeza de proyección. Los modelos PPCA están localizados alrededor de las medias de clase y los modelos de las clases existentes no se vuelven a entrenar cuando se agregan nuevas clases. El algoritmo de aprendizaje es un -Means modificado que congela los modelos en las clases existentes y solo actualiza los modelos para las nuevas clases. Esto hace que el enfoque sea tanto computacionalmente eficiente como preciso. Experimentos extensos en CUB200, CIFAR100 y miniImageNet muestran la efectividad del enfoque propuesto. Además, experimentos en el conjunto de datos ImageNet-1k, que métodos anteriores han evitado debido a su tamaño, demuestran su aplicabilidad a conjuntos de datos a gran escala.
Descripción
Este documento presenta un método novedoso para el Aprendizaje Incremental de Clases de Pocas Muestras Semi-Supervisado (SSFSCIL) que no muestra prácticamente ningún olvido catastrófico. El método utiliza un extractor de características genérico que fue preentrenado sin supervisión en un gran conjunto de datos de imágenes, y un clasificador basado en un modelo de Análisis de Componentes Principales Probabilístico (PPCA) para cada clase en lugar de la capa completamente conectada estándar generalmente empleada como la cabeza de proyección. Los modelos PPCA están localizados alrededor de las medias de clase y los modelos de las clases existentes no se vuelven a entrenar cuando se agregan nuevas clases. El algoritmo de aprendizaje es un -Means modificado que congela los modelos en las clases existentes y solo actualiza los modelos para las nuevas clases. Esto hace que el enfoque sea tanto computacionalmente eficiente como preciso. Experimentos extensos en CUB200, CIFAR100 y miniImageNet muestran la efectividad del enfoque propuesto. Además, experimentos en el conjunto de datos ImageNet-1k, que métodos anteriores han evitado debido a su tamaño, demuestran su aplicabilidad a conjuntos de datos a gran escala.