Un análisis de los métodos modernos de detección de deepfakes de audio: desafíos y direcciones futuras
Autores: Almutairi, Zaynab; Elgibreen, Hebah
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un análisis de los métodos modernos de detección de deepfakes de audio: desafíos y direcciones futuras
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Herramientas generadas por IA
Deepfakes de audio
Aprendizaje automático
Aprendizaje profundo
Métodos de detección
Deepfakes basados en síntesis
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 49
Citaciones: Sin citaciones
Varios herramientas generadas por inteligencia artificial se utilizan hoy en día para clonar voces humanas, lo que ha llevado al desarrollo de una nueva tecnología conocida como Audio Deepfakes (ADs). A pesar de haber sido introducidos para mejorar la vida humana como audiolibros, los ADs se han utilizado para perturbar la seguridad pública. Por lo tanto, recientemente los investigadores han prestado atención a los ADs, desarrollando métodos de Aprendizaje Automático (ML) y Aprendizaje Profundo (DL) para detectarlos. En este artículo, se realizó una revisión de los métodos de detección de AD existentes, junto con una descripción comparativa de los conjuntos de datos de audio falsificados disponibles. El artículo presenta tipos de ataques de AD y luego describe y analiza los métodos de detección y conjuntos de datos para Deepfakes basados en imitación y síntesis. Hasta donde saben los autores, esta es la primera revisión que se enfoca en los métodos de detección de audio imitado y generado sintéticamente. Las similitudes y diferencias de los métodos de detección de AD se resumen mediante una comparación cuantitativa que encuentra que el tipo de método afecta más al rendimiento que las propias características de audio, en donde existe un equilibrio sustancial entre la precisión y la escalabilidad. Además, al final de este artículo, se discuten las posibles direcciones de investigación y desafíos de los métodos de detección de Deepfakes para descubrir que, aunque la detección de AD es un área activa de investigación, aún se necesitan más investigaciones para abordar las brechas existentes. Este artículo puede ser un punto de partida para que los investigadores comprendan el estado actual de la literatura de AD e investiguen modelos de detección más robustos que puedan detectar la falsedad incluso si el audio objetivo contiene voces acentuadas o ruidos del mundo real.
Descripción
Varios herramientas generadas por inteligencia artificial se utilizan hoy en día para clonar voces humanas, lo que ha llevado al desarrollo de una nueva tecnología conocida como Audio Deepfakes (ADs). A pesar de haber sido introducidos para mejorar la vida humana como audiolibros, los ADs se han utilizado para perturbar la seguridad pública. Por lo tanto, recientemente los investigadores han prestado atención a los ADs, desarrollando métodos de Aprendizaje Automático (ML) y Aprendizaje Profundo (DL) para detectarlos. En este artículo, se realizó una revisión de los métodos de detección de AD existentes, junto con una descripción comparativa de los conjuntos de datos de audio falsificados disponibles. El artículo presenta tipos de ataques de AD y luego describe y analiza los métodos de detección y conjuntos de datos para Deepfakes basados en imitación y síntesis. Hasta donde saben los autores, esta es la primera revisión que se enfoca en los métodos de detección de audio imitado y generado sintéticamente. Las similitudes y diferencias de los métodos de detección de AD se resumen mediante una comparación cuantitativa que encuentra que el tipo de método afecta más al rendimiento que las propias características de audio, en donde existe un equilibrio sustancial entre la precisión y la escalabilidad. Además, al final de este artículo, se discuten las posibles direcciones de investigación y desafíos de los métodos de detección de Deepfakes para descubrir que, aunque la detección de AD es un área activa de investigación, aún se necesitan más investigaciones para abordar las brechas existentes. Este artículo puede ser un punto de partida para que los investigadores comprendan el estado actual de la literatura de AD e investiguen modelos de detección más robustos que puedan detectar la falsedad incluso si el audio objetivo contiene voces acentuadas o ruidos del mundo real.