logo móvil
Contáctanos

Restauración estocástica de audio musical fuertemente comprimido utilizando redes generativas adversarias

Autores: Lattner, Stefan; Nistal, Javier

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico
2021

Restauración estocástica de audio musical fuertemente comprimido utilizando redes generativas adversarias


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Códecs de audio
Eliminación de artefactos de compresión
Técnicas de aprendizaje profundo
Red Generativa Adversaria (GAN)
Almacenamiento de datos musicales
Señales de audio comprimidas en MP3

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 40

Citaciones: Sin citaciones


Descripción
Los códecs de audio con pérdida comprimen (y descomprimen) flujos de audio digital eliminando información que tiende a ser inaudible para la percepción humana. Bajo tasas de compresión altas, dichos códecs pueden introducir una variedad de deterioros en la señal de audio. Muchos trabajos han abordado el problema de mejora de audio y eliminación de artefactos de compresión utilizando técnicas de aprendizaje profundo. Sin embargo, solo unos pocos trabajos abordan la restauración de señales de audio en el . En tal escenario, no hay una solución única para la restauración de la señal original. Por lo tanto, en este estudio, probamos un generador de una arquitectura de Red Generativa Adversarial (GAN) para esta tarea. Un generador estocástico, condicionado a señales de audio musical altamente comprimidas, podría llegar a generar salidas indistinguibles de lanzamientos de alta calidad. Por lo tanto, el presente estudio podría proporcionar información sobre un almacenamiento y transmisión de datos musicales más eficientes. Entrenamos generadores estocásticos y determinísticos en señales de audio comprimidas en MP3 con 16, 32 y 64 kbit/s. Realizamos una evaluación exhaustiva de los diferentes experimentos utilizando métricas objetivas y pruebas de escucha. Descubrimos que los modelos pueden mejorar la calidad de las señales de audio sobre las versiones MP3 para 16 y 32 kbit/s y que los generadores estocásticos son capaces de generar salidas que están más cerca de las señales originales que las de los generadores determinísticos.

Otros recursos que podrían interesarte

Temas Virtualpro