Método de minería auto-probabilística para el entrenamiento de redes neuronales siamesas
Autores: Mokin, Arseniy; Sheshkus, Alexander; Arlazarov, Vladimir L.
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Método de minería auto-probabilística para el entrenamiento de redes neuronales siamesas
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Entrenamiento
Modelos de aprendizaje profundo
Datos limitados
Recursos computacionales
Aprendizaje de métricas
Funciones de pérdida
Pérdida de tripletes
Métodos de extracción de muestras
Redes neuronales Siamesas
Función de pérdida métrica basada en tripletes consciente de clústeres
Reconocimiento óptico de caracteres
Conjunto de datos PHD08
Conjunto de datos Omniglot
Precisión de clasificación
Alfabeto coreano
Referencia base
Reconocimiento de patrones.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
Entrenar modelos de aprendizaje profundo para clasificación con datos limitados y recursos computacionales sigue siendo un desafío cuando el número de clases es grande. El aprendizaje métrico ofrece una solución efectiva a este problema. Sin embargo, tiene sus propias limitaciones debido a las imperfecciones conocidas de las funciones de pérdida ampliamente utilizadas como la pérdida contrastiva y la pérdida triplet, así como los métodos de extracción de muestras. Este documento aborda estos problemas proponiendo un nuevo método de extracción y una función de pérdida métrica.
Descripción
Entrenar modelos de aprendizaje profundo para clasificación con datos limitados y recursos computacionales sigue siendo un desafío cuando el número de clases es grande. El aprendizaje métrico ofrece una solución efectiva a este problema. Sin embargo, tiene sus propias limitaciones debido a las imperfecciones conocidas de las funciones de pérdida ampliamente utilizadas como la pérdida contrastiva y la pérdida triplet, así como los métodos de extracción de muestras. Este documento aborda estos problemas proponiendo un nuevo método de extracción y una función de pérdida métrica.