Un sistema mejorado de detección y clasificación de videos DeepFake basado en aprendizaje profundo mejorado
Autores: Awotunde, Joseph Bamidele; Jimoh, Rasheed Gbenga; Imoize, Agbotiname Lucky; Abdulrazaq, Akeem Tayo; Li, Chun-Ta; Lee, Cheng-Chi
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un sistema mejorado de detección y clasificación de videos DeepFake basado en aprendizaje profundo mejorado
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Intercambio de rostros
Modelos DeepFake
Redes neuronales convolucionales
ReLU
Detección de DeepFake
Fotogramas de video
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 39
Citaciones: Sin citaciones
La privacidad de individuos y países enteros está siendo amenazada actualmente por el uso generalizado de modelos DeepFake de intercambio de rostros, que resultan en una cantidad considerable de videos falsos que parecen extraordinariamente genuinos. Dado que las herramientas de producción de DeepFake han avanzado tanto y dado que muchos investigadores y empresas están interesados en probar sus límites, los medios falsos se están propagando como un reguero de pólvora por Internet. Por lo tanto, este estudio propone redes neuronales convolucionales (CNN) de cinco capas para un modelo de detección y clasificación de DeepFake. La CNN mejorada con ReLU se utiliza para extraer características de estos rostros una vez que el modelo ha extraído la región facial de los fotogramas de video. Para garantizar la precisión del modelo manteniendo un peso adecuado, se utilizó un modelo de CNN habilitado con ReLU para el video influenciado por la detección de DeepFake. La evaluación del rendimiento del modelo propuesto se probó utilizando conjuntos de datos de Face2Face y de DeepFake de movimiento de primer orden. Los resultados experimentales revelaron que el modelo propuesto tiene una tasa de predicción promedio del 98% para videos DeepFake y del 95% para videos Face2Face bajo circunstancias reales de difusión en la red. En comparación con sistemas como Meso4, MesoInception4, Xception, EfficientNet-B0 y VGG16 que utilizan la red neuronal convolucional, el modelo sugerido produjo los mejores resultados con una tasa de precisión del 86%.
Descripción
La privacidad de individuos y países enteros está siendo amenazada actualmente por el uso generalizado de modelos DeepFake de intercambio de rostros, que resultan en una cantidad considerable de videos falsos que parecen extraordinariamente genuinos. Dado que las herramientas de producción de DeepFake han avanzado tanto y dado que muchos investigadores y empresas están interesados en probar sus límites, los medios falsos se están propagando como un reguero de pólvora por Internet. Por lo tanto, este estudio propone redes neuronales convolucionales (CNN) de cinco capas para un modelo de detección y clasificación de DeepFake. La CNN mejorada con ReLU se utiliza para extraer características de estos rostros una vez que el modelo ha extraído la región facial de los fotogramas de video. Para garantizar la precisión del modelo manteniendo un peso adecuado, se utilizó un modelo de CNN habilitado con ReLU para el video influenciado por la detección de DeepFake. La evaluación del rendimiento del modelo propuesto se probó utilizando conjuntos de datos de Face2Face y de DeepFake de movimiento de primer orden. Los resultados experimentales revelaron que el modelo propuesto tiene una tasa de predicción promedio del 98% para videos DeepFake y del 95% para videos Face2Face bajo circunstancias reales de difusión en la red. En comparación con sistemas como Meso4, MesoInception4, Xception, EfficientNet-B0 y VGG16 que utilizan la red neuronal convolucional, el modelo sugerido produjo los mejores resultados con una tasa de precisión del 86%.