logo móvil
Contáctanos

Aliviar la clasificación de imágenes de cola larga a través de la división dinámica por clase

Autores: Yuan, Ye; Wang, Jiaqi; Xu, Xin; Li, Ruoshi; Zhu, Yongtong; Wan, Lihong; Li, Qingdu; Liu, Na

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Aliviar la clasificación de imágenes de cola larga a través de la división dinámica por clase


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Aumento rápido
Distribuciones de clases de cola larga
Estrategias de reequilibrio de clases
División por categorías
División por clases
Grupo dinámico

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 29

Citaciones: Sin citaciones


Descripción
Con el rápido aumento en la escala de datos, los conjuntos de datos del mundo real tienden a mostrar distribuciones de clases de cola larga (es decir, unas pocas clases representan la mayor parte de los datos, mientras que la mayoría de las clases contienen solo unos pocos puntos de datos). Las soluciones generales típicamente explotan estrategias de reequilibrio de clases que implican el remuestreo y el reajuste basado en el número de muestras para cada clase. En este trabajo, exploramos una dirección ortogonal, la división por categorías, que está motivada por la observación empírica de que la división ingenua de muestras mayoritarias podría aliviar el desequilibrio entre las clases mayoritarias y minoritarias. Con este fin, proponemos un método de división por clase novedoso (CWS) construido sobre un clúster dinámico, donde los prototipos por clase se actualizan utilizando una técnica de promedio móvil. CWS genera etiquetas seudoclase intra-clase para dividir las muestras intra-clase basadas en la distancia punto a punto. Además, se desarrolló un módulo de mapeo de grupos para recuperar la verdad fundamental de las muestras de entrenamiento. CWS se puede integrar en cualquier método existente como complemento. Se realizaron experimentos exhaustivos en conjuntos de datos de clasificación de imágenes de cola larga inducidos artificialmente, como CIFAR-10-LT, CIFAR-100-LT y OCTMNIST. Nuestros resultados muestran que cuando se entrena con la pérdida equilibrada por clase propuesta, la red puede lograr mejoras significativas en el rendimiento en conjuntos de datos de cola larga.

Otros recursos que podrían interesarte

Temas Virtualpro