Dos ramas de atención para el aprendizaje incremental de clases detalladas
Autores: Guo, Jiaqi; Qi, Guanqiu; Xie, Shuiqing; Li, Xiangyuan
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Dos ramas de atención para el aprendizaje incremental de clases detalladas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
área de investigación
Aprendizaje incremental de clase
Categorización visual detallada
Localización
Regiones críticas
Red de aprendizaje de atención de dos ramas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
Como área de investigación de larga data, el aprendizaje incremental de clases (CIL) tiene como objetivo aprender de manera efectiva un clasificador unificado junto con el crecimiento del número de clases. Debido a las pequeñas variaciones interclase y las grandes variaciones intraclase, la categorización visual detallada (FGVC) como una tarea visual desafiante no ha atraído suficiente atención en CIL. Por lo tanto, la localización de regiones críticas especializadas para el reconocimiento de objetos detallados desempeña un papel crucial en FGVC. Además, es importante aprender características detalladas de las regiones críticas en CIL detallado para el reconocimiento de nuevas clases de objetos. Este documento diseña una arquitectura de red llamada red de aprendizaje de atención de dos ramas (TBAL-Net) para CIL detallado. TBAL-Net puede localizar regiones críticas y aprender representaciones de características detalladas mediante un módulo de atención ligero. Se propone un marco de entrenamiento efectivo para CIL detallado integrando TBAL-Net en un proceso de CIL efectivo. Este marco se prueba en tres conjuntos de datos populares de objetos detallados, incluidos CUB-200-2011, FGVC-Aircraft y Stanford-Car. Los resultados experimentales comparativos demuestran que el marco propuesto puede lograr un rendimiento de vanguardia en los tres conjuntos de datos de objetos detallados.
Descripción
Como área de investigación de larga data, el aprendizaje incremental de clases (CIL) tiene como objetivo aprender de manera efectiva un clasificador unificado junto con el crecimiento del número de clases. Debido a las pequeñas variaciones interclase y las grandes variaciones intraclase, la categorización visual detallada (FGVC) como una tarea visual desafiante no ha atraído suficiente atención en CIL. Por lo tanto, la localización de regiones críticas especializadas para el reconocimiento de objetos detallados desempeña un papel crucial en FGVC. Además, es importante aprender características detalladas de las regiones críticas en CIL detallado para el reconocimiento de nuevas clases de objetos. Este documento diseña una arquitectura de red llamada red de aprendizaje de atención de dos ramas (TBAL-Net) para CIL detallado. TBAL-Net puede localizar regiones críticas y aprender representaciones de características detalladas mediante un módulo de atención ligero. Se propone un marco de entrenamiento efectivo para CIL detallado integrando TBAL-Net en un proceso de CIL efectivo. Este marco se prueba en tres conjuntos de datos populares de objetos detallados, incluidos CUB-200-2011, FGVC-Aircraft y Stanford-Car. Los resultados experimentales comparativos demuestran que el marco propuesto puede lograr un rendimiento de vanguardia en los tres conjuntos de datos de objetos detallados.