Pgd-Trap: defensa proactiva contra deepfakes con señales adversarias pegajosas y refinamiento iterativo de variables latentes
Autores: Zhuang, Zhong; Tomioka, Yoichi; Shin, Jungpil; Okuyama, Yuichi
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Pgd-Trap: defensa proactiva contra deepfakes con señales adversarias pegajosas y refinamiento iterativo de variables latentes
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Desarrollo
Inteligencia artificial
Deepfakes
Contramedidas
Señales adversarias
Defensa
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 44
Citaciones: Sin citaciones
Con el desarrollo de la inteligencia artificial (IA), los deepfakes, en los que el rostro de una persona se cambia por la expresión de otra persona o de una persona diferente, han avanzado. Existe la necesidad de contramedidas contra los delitos que explotan los deepfakes. Se han propuesto métodos para interferir con la generación de deepfakes agregando una señal adversaria débil invisible a una imagen. Sin embargo, hay un problema: la señal débil puede ser eliminada fácilmente al procesar la imagen. En este documento, proponemos señales trampa que aparecen en respuesta a un proceso que debilita las señales adversarias. También proponemos un nuevo tipo de inyección de señal adversaria que nos permite reconstruir y cambiar la imagen original siempre y cuando las personas no sientan algo extraño mediante el Refinamiento de Variables Latentes Iterativo basado en el Modelo Probabilístico de Difusión de Desenfoque (DDPM). En nuestros experimentos con la Red Generativa Antagónica Estelar (StarGAN) entrenada con el Conjunto de Datos de Atributos de CelebFaces (CelebA), demostramos que el enfoque propuesto logra una defensa proactiva más robusta contra los deepfakes.
Descripción
Con el desarrollo de la inteligencia artificial (IA), los deepfakes, en los que el rostro de una persona se cambia por la expresión de otra persona o de una persona diferente, han avanzado. Existe la necesidad de contramedidas contra los delitos que explotan los deepfakes. Se han propuesto métodos para interferir con la generación de deepfakes agregando una señal adversaria débil invisible a una imagen. Sin embargo, hay un problema: la señal débil puede ser eliminada fácilmente al procesar la imagen. En este documento, proponemos señales trampa que aparecen en respuesta a un proceso que debilita las señales adversarias. También proponemos un nuevo tipo de inyección de señal adversaria que nos permite reconstruir y cambiar la imagen original siempre y cuando las personas no sientan algo extraño mediante el Refinamiento de Variables Latentes Iterativo basado en el Modelo Probabilístico de Difusión de Desenfoque (DDPM). En nuestros experimentos con la Red Generativa Antagónica Estelar (StarGAN) entrenada con el Conjunto de Datos de Atributos de CelebFaces (CelebA), demostramos que el enfoque propuesto logra una defensa proactiva más robusta contra los deepfakes.