Marco eficiente de identificación de manipulación de imágenes faciales basado en visión y aprendizaje profundo
Autores: Dang, Minh
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Marco eficiente de identificación de manipulación de imágenes faciales basado en visión y aprendizaje profundo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Manipulación de imágenes
Rostro humano
Falsificación
Redes sociales
Imágenes manipuladas
Detección
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
La manipulación de imágenes del rostro humano es un tema de tendencia en la falsificación de imágenes, que se realiza transformando o alterando regiones faciales mediante un conjunto de técnicas para lograr resultados deseados. Las imágenes de rostros manipulados se están propagando en internet debido al aumento de las redes sociales, lo que provoca diversas amenazas sociales. Es difícil detectar eficazmente las imágenes de rostros manipulados porque (i) ha habido un número limitado de conjuntos de datos de rostros manipulados, ya que la mayoría de los conjuntos de datos contenían imágenes generadas por modelos GAN; (ii) estudios anteriores principalmente extrajeron características hechas a mano y las introdujeron en algoritmos de aprendizaje automático para realizar la detección de rostros manipulados, lo que era complicado, propenso a errores y laborioso; y (iii) los modelos anteriores no lograron demostrar por qué su modelo logró buenos rendimientos. Para abordar estos problemas, este estudio presenta un gran conjunto de datos de manipulación facial que contiene amplias variaciones de imágenes manipuladas creadas y validadas manualmente utilizando diversas técnicas de manipulación. Luego, el conjunto de datos se utiliza para entrenar un modelo RegNet afinado para detectar imágenes de rostros manipulados de manera robusta y eficiente. Finalmente, se implementa una técnica de análisis de regiones manipuladas para proporcionar una visión más profunda de las regiones manipuladas. Los resultados experimentales revelaron que el modelo RegNet mostró la mayor precisión de clasificación del 89% en el conjunto de datos propuesto en comparación con los modelos estándar de aprendizaje profundo.
Descripción
La manipulación de imágenes del rostro humano es un tema de tendencia en la falsificación de imágenes, que se realiza transformando o alterando regiones faciales mediante un conjunto de técnicas para lograr resultados deseados. Las imágenes de rostros manipulados se están propagando en internet debido al aumento de las redes sociales, lo que provoca diversas amenazas sociales. Es difícil detectar eficazmente las imágenes de rostros manipulados porque (i) ha habido un número limitado de conjuntos de datos de rostros manipulados, ya que la mayoría de los conjuntos de datos contenían imágenes generadas por modelos GAN; (ii) estudios anteriores principalmente extrajeron características hechas a mano y las introdujeron en algoritmos de aprendizaje automático para realizar la detección de rostros manipulados, lo que era complicado, propenso a errores y laborioso; y (iii) los modelos anteriores no lograron demostrar por qué su modelo logró buenos rendimientos. Para abordar estos problemas, este estudio presenta un gran conjunto de datos de manipulación facial que contiene amplias variaciones de imágenes manipuladas creadas y validadas manualmente utilizando diversas técnicas de manipulación. Luego, el conjunto de datos se utiliza para entrenar un modelo RegNet afinado para detectar imágenes de rostros manipulados de manera robusta y eficiente. Finalmente, se implementa una técnica de análisis de regiones manipuladas para proporcionar una visión más profunda de las regiones manipuladas. Los resultados experimentales revelaron que el modelo RegNet mostró la mayor precisión de clasificación del 89% en el conjunto de datos propuesto en comparación con los modelos estándar de aprendizaje profundo.