¿Se puede utilizar la pérdida de triplete para la clasificación de pocos disparos con múltiples etiquetas? Un estudio de caso
Autores: Csányi, Gergely Márk; Vági, Renátó; Megyeri, Andrea; Fülöp, Anna; Nagy, Dániel; Vadász, János Pál; Üveges, István
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
¿Se puede utilizar la pérdida de triplete para la clasificación de pocos disparos con múltiples etiquetas? Un estudio de caso
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Aprendizaje profundo
Aprendizaje de pocos ejemplos
Red siamés
Clasificación multietiqueta
Decisiones legales
Clasificación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El aprendizaje de pocos ejemplos es un subcampo del aprendizaje profundo que es el foco de investigación en la actualidad. Este artículo aborda la pregunta de investigación de si una red siamés entrenada con tripletas, diseñada inicialmente para clasificación multiclase, puede manejar eficazmente la clasificación multilabel. Realizamos un estudio de caso para identificar cualquier limitación en su aplicación. Los experimentos se llevaron a cabo en un conjunto de datos que contiene decisiones legales húngaras de agencias administrativas en asuntos fiscales pertenecientes a un importante proveedor de contenido legal. También probamos cómo se comparan diferentes incrustaciones siamés en la clasificación de una etiqueta previamente no existente en un entorno binario y multilabel. Encontramos que las redes siamés entrenadas con tripletas pueden aplicarse para realizar clasificación, pero con una restricción de muestreo durante el entrenamiento. También descubrimos que la superposición entre etiquetas afecta negativamente los resultados. El modelo de pocos ejemplos, viendo solo diez ejemplos para cada etiqueta, proporcionó resultados competitivos en comparación con modelos entrenados en decenas de miles de decisiones judiciales utilizando vectorización tf-idf y regresión logística.
Descripción
El aprendizaje de pocos ejemplos es un subcampo del aprendizaje profundo que es el foco de investigación en la actualidad. Este artículo aborda la pregunta de investigación de si una red siamés entrenada con tripletas, diseñada inicialmente para clasificación multiclase, puede manejar eficazmente la clasificación multilabel. Realizamos un estudio de caso para identificar cualquier limitación en su aplicación. Los experimentos se llevaron a cabo en un conjunto de datos que contiene decisiones legales húngaras de agencias administrativas en asuntos fiscales pertenecientes a un importante proveedor de contenido legal. También probamos cómo se comparan diferentes incrustaciones siamés en la clasificación de una etiqueta previamente no existente en un entorno binario y multilabel. Encontramos que las redes siamés entrenadas con tripletas pueden aplicarse para realizar clasificación, pero con una restricción de muestreo durante el entrenamiento. También descubrimos que la superposición entre etiquetas afecta negativamente los resultados. El modelo de pocos ejemplos, viendo solo diez ejemplos para cada etiqueta, proporcionó resultados competitivos en comparación con modelos entrenados en decenas de miles de decisiones judiciales utilizando vectorización tf-idf y regresión logística.