logo móvil
Contáctanos

Técnica de entrenamiento progresivo con refuerzo de etiquetas débiles para clasificación detallada en datos de entrenamiento desequilibrados

Autores: Jin, Yuhui; Wang, Zuyun; Liao, Huimin; Zhu, Sainan; Tong, Bin; Yin, Yu; Huang, Jian

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Técnica de entrenamiento progresivo con refuerzo de etiquetas débiles para clasificación detallada en datos de entrenamiento desequilibrados


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Tareas de clasificación prácticas
Distribución de muestras desequilibrada
Etiquetas débiles
Problemas de pocas muestras
Análisis detallado
Técnica de entrenamiento progresivo

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 43

Citaciones: Sin citaciones


Descripción
En tareas de clasificación prácticas, la distribución de muestra del conjunto de datos a menudo es desequilibrada; por ejemplo, este es el caso en un conjunto de datos que contiene una cantidad masiva de muestras con etiquetas débiles y para las cuales la identificación concreta no está disponible. Incluso en muestras con etiquetas exactas, el número de muestras correspondientes a muchas etiquetas es pequeño, lo que resulta en dificultades para aprender los conceptos a través de un pequeño número de muestras etiquetadas. Además, siempre hay una pequeña varianza entre clases y una gran varianza intraclase entre categorías. Las etiquetas débiles, los problemas de poca muestra y el análisis detallado son los principales desafíos que afectan el rendimiento del modelo de clasificación. En este documento, desarrollamos una técnica de entrenamiento progresivo para abordar el desafío de la poca muestra, junto con un método de refuerzo de etiquetas débiles, considerando todas las IDs débiles como muestras negativas de cada ID predefinida para aprovechar al máximo los datos de etiquetas débiles más numerosos. Introducimos una estrategia de minería de IDs difíciles conscientes de la instancia en la pérdida de clasificación y luego desarrollamos más la pérdida de mapeo de características globales y locales para expandir el margen de decisión. Introdujimos el método propuesto en la competencia de Kaggle, que tiene como objetivo construir un algoritmo para identificar ballenas jorobadas individuales en imágenes. Con algunos otros trucos de entrenamiento comunes, el enfoque propuesto ganó el primer lugar en la competencia. Los tres problemas (etiquetas débiles, problemas de poca muestra y análisis detallado) existen en el conjunto de datos utilizado en la competencia. Además, aplicamos nuestro método a CUB-2011 y Cars-196, que son los conjuntos de datos más utilizados para tareas de categorización visual detallada, y logramos precisión respectivas del 90.1% y 94.9%. Este experimento muestra que el método propuesto logra el efecto óptimo en comparación con otros baselines comunes, y verifica la efectividad de nuestro método. Nuestra solución ha sido puesta a disposición como un proyecto de código abierto.

Otros recursos que podrían interesarte

Temas Virtualpro