logo móvil
Contáctanos

TraceGuard: ajuste fino del modelo pre-entrenado utilizando imágenes esteganográficas para rastrear a su usuario

Autores: Zhou, Limengnan; Ren, Xingdong; Qian, Cheng; Sun, Guangling

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

TraceGuard: ajuste fino del modelo pre-entrenado utilizando imágenes esteganográficas para rastrear a su usuario


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Modelos pre-entrenados
Aprendizaje automático como servicio
Marco TraceGuard
Esteganografía
Rastreo de modelos sospechosos
Técnicas de huellas digitales

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 42

Citaciones: Sin citaciones


Descripción
Actualmente, un número significativo de modelos pre-entrenados se publican en línea para brindar servicios a los usuarios debido a la rápida maduración y popularización del aprendizaje automático como servicio (MLaaS). Algunos usuarios malintencionados han pre-entrenado modelos ilegalmente para volver a implementarlos y ganar dinero. Sin embargo, la mayoría de los métodos actuales se centran en verificar los derechos de autor del modelo en lugar de rastrear la responsabilidad del modelo sospechoso. En este estudio, se propone TraceGuard, el primer marco basado en esteganografía para rastrear un modelo pre-entrenado sospechoso de aprendizaje auto-supervisado (SSL), para determinar qué usuario autorizado lanzó ilegalmente el modelo sospechoso o si el modelo sospechoso es independiente. Concretamente, el marco contiene un par de codificador y decodificador y el modelo pre-entrenado SSL. Inicialmente, el modelo pre-entrenado base está congelado, y el codificador y decodificador se aprenden conjuntamente para asegurar que los dos módulos puedan incrustar la clave secreta en la imagen de portada y extraer la clave secreta de la salida de incrustación por el modelo pre-entrenado base. Posteriormente, el modelo pre-entrenado base se ajusta finamente utilizando imágenes estego para implementar una huella digital mientras que el codificador y decodificador están congelados. Para asegurar la efectividad y robustez de la huella digital y la utilidad de los modelos pre-entrenados con huella digital, se diseñan tres pasos alternativos de simulaciones de robo de modelos, ajuste fino para la singularidad y ajuste fino para la utilidad. Finalmente, el modelo pre-entrenado sospechoso se rastrea hasta su usuario consultando imágenes estego. Los resultados experimentales demuestran que TraceGuard puede rastrear de manera confiable modelos sospechosos y es robusto contra ataques comunes de eliminación de huellas digitales como ajuste fino, poda y robo de modelos. En el futuro, mejoraremos aún más la robustez contra el ataque de robo de modelos.

Otros recursos que podrían interesarte

Temas Virtualpro