Técnica de entrenamiento progresivo con refuerzo de etiquetas débiles para clasificación detallada en datos de entrenamiento desequilibrados

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Técnica de entrenamiento progresivo con refuerzo de etiquetas débiles para clasificación detallada en datos de entrenamiento desequilibrados

Autores: Jin, Yuhui; Wang, Zuyun; Liao, Huimin; Zhu, Sainan; Tong, Bin; Yin, Yu; Huang, Jian

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico

2022

Técnica de entrenamiento progresivo con refuerzo de etiquetas débiles para clasificación detallada en datos de entrenamiento desequilibrados

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Tareas de clasificación prácticas

Distribución de muestras desequilibrada

Etiquetas débiles

Problemas de pocas muestras

Análisis detallado

Técnica de entrenamiento progresivo

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 43

Citaciones: Sin citaciones

En tareas de clasificación prácticas, la distribución de muestra del conjunto de datos a menudo es desequilibrada; por ejemplo, este es el caso en un conjunto de datos que contiene una cantidad masiva de muestras con etiquetas débiles y para las cuales la identificación concreta no está disponible. Incluso en muestras con etiquetas exactas, el número de muestras correspondientes a muchas etiquetas es pequeño, lo que resulta en dificultades para aprender los conceptos a través de un pequeño número de muestras etiquetadas. Además, siempre hay una pequeña varianza entre clases y una gran varianza intraclase entre categorías. Las etiquetas débiles, los problemas de poca muestra y el análisis detallado son los principales desafíos que afectan el rendimiento del modelo de clasificación. En este documento, desarrollamos una técnica de entrenamiento progresivo para abordar el desafío de la poca muestra, junto con un método de refuerzo de etiquetas débiles, considerando todas las IDs débiles como muestras negativas de cada ID predefinida para aprovechar al máximo los datos de etiquetas débiles más numerosos. Introducimos una estrategia de minería de IDs difíciles conscientes de la instancia en la pérdida de clasificación y luego desarrollamos más la pérdida de mapeo de características globales y locales para expandir el margen de decisión. Introdujimos el método propuesto en la competencia de Kaggle, que tiene como objetivo construir un algoritmo para identificar ballenas jorobadas individuales en imágenes. Con algunos otros trucos de entrenamiento comunes, el enfoque propuesto ganó el primer lugar en la competencia. Los tres problemas (etiquetas débiles, problemas de poca muestra y análisis detallado) existen en el conjunto de datos utilizado en la competencia. Además, aplicamos nuestro método a CUB-2011 y Cars-196, que son los conjuntos de datos más utilizados para tareas de categorización visual detallada, y logramos precisión respectivas del 90.1% y 94.9%. Este experimento muestra que el método propuesto logra el efecto óptimo en comparación con otros baselines comunes, y verifica la efectividad de nuestro método. Nuestra solución ha sido puesta a disposición como un proyecto de código abierto.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro