Aprendizaje de poca cantidad basado en doble agrupamiento de atención de exprimir y excitar
Autores: Xu, Qiuyu; Su, Jie; Wang, Ying; Zhang, Jing; Zhong, Yixin
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Aprendizaje de poca cantidad basado en doble agrupamiento de atención de exprimir y excitar
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aprendizaje de pocas muestras
Modelo
DSE
Atención
Características
Conjuntos de datos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 42
Citaciones: Sin citaciones
Entrenar un modelo generalizado y confiable es un gran desafío, ya que en algunos escenarios de aplicación abiertos no se dispone de suficientes datos etiquetados. El aprendizaje de pocas muestras (FSL) tiene como objetivo aprender nuevos problemas con solo unos pocos ejemplos que pueden abordar este problema y atraer una atención extensa. Este artículo propone un nuevo método de aprendizaje de pocas muestras basado en la atención de doble agrupación de apretar y excitar (dSE) con el propósito de mejorar la capacidad discriminativa del modelo al proponer una nueva expresión de características. Específicamente, el módulo dSE propuesto adopta dos tipos de agrupación para enfatizar características que responden a los canales de objetos en primer plano. Empleamos tanto el descriptor de píxeles como el descriptor de canal para capturar características de canal localmente identificables y características de píxeles de una imagen (a diferencia de los métodos tradicionales de aprendizaje de pocas muestras). Además, con el fin de mejorar la robustez del modelo, diseñamos una nueva función de pérdida. Para verificar el rendimiento del método, se realizaron una gran cantidad de experimentos en múltiples conjuntos de datos de referencia de imágenes de pocas muestras estándar, mostrando que nuestro marco puede superar a varios enfoques existentes. Además, realizamos experimentos extensos en tres conjuntos de datos de pocas muestras más desafiantes y detallados, los resultados experimentales demuestran que el método propuesto logra un rendimiento de vanguardia. En particular, este trabajo logra una precisión del 92.36% en el escenario de clasificación de 5 vías y 5 tomas del conjunto de datos de Stanford Cars.
Descripción
Entrenar un modelo generalizado y confiable es un gran desafío, ya que en algunos escenarios de aplicación abiertos no se dispone de suficientes datos etiquetados. El aprendizaje de pocas muestras (FSL) tiene como objetivo aprender nuevos problemas con solo unos pocos ejemplos que pueden abordar este problema y atraer una atención extensa. Este artículo propone un nuevo método de aprendizaje de pocas muestras basado en la atención de doble agrupación de apretar y excitar (dSE) con el propósito de mejorar la capacidad discriminativa del modelo al proponer una nueva expresión de características. Específicamente, el módulo dSE propuesto adopta dos tipos de agrupación para enfatizar características que responden a los canales de objetos en primer plano. Empleamos tanto el descriptor de píxeles como el descriptor de canal para capturar características de canal localmente identificables y características de píxeles de una imagen (a diferencia de los métodos tradicionales de aprendizaje de pocas muestras). Además, con el fin de mejorar la robustez del modelo, diseñamos una nueva función de pérdida. Para verificar el rendimiento del método, se realizaron una gran cantidad de experimentos en múltiples conjuntos de datos de referencia de imágenes de pocas muestras estándar, mostrando que nuestro marco puede superar a varios enfoques existentes. Además, realizamos experimentos extensos en tres conjuntos de datos de pocas muestras más desafiantes y detallados, los resultados experimentales demuestran que el método propuesto logra un rendimiento de vanguardia. En particular, este trabajo logra una precisión del 92.36% en el escenario de clasificación de 5 vías y 5 tomas del conjunto de datos de Stanford Cars.