Restauración estocástica de audio musical fuertemente comprimido utilizando redes generativas adversarias

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Restauración estocástica de audio musical fuertemente comprimido utilizando redes generativas adversarias

Autores: Lattner, Stefan; Nistal, Javier

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico

2021

Restauración estocástica de audio musical fuertemente comprimido utilizando redes generativas adversarias

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Códecs de audio

Eliminación de artefactos de compresión

Técnicas de aprendizaje profundo

Red Generativa Adversaria (GAN)

Almacenamiento de datos musicales

Señales de audio comprimidas en MP3

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 40

Citaciones: Sin citaciones

Los códecs de audio con pérdida comprimen (y descomprimen) flujos de audio digital eliminando información que tiende a ser inaudible para la percepción humana. Bajo tasas de compresión altas, dichos códecs pueden introducir una variedad de deterioros en la señal de audio. Muchos trabajos han abordado el problema de mejora de audio y eliminación de artefactos de compresión utilizando técnicas de aprendizaje profundo. Sin embargo, solo unos pocos trabajos abordan la restauración de señales de audio en el . En tal escenario, no hay una solución única para la restauración de la señal original. Por lo tanto, en este estudio, probamos un generador de una arquitectura de Red Generativa Adversarial (GAN) para esta tarea. Un generador estocástico, condicionado a señales de audio musical altamente comprimidas, podría llegar a generar salidas indistinguibles de lanzamientos de alta calidad. Por lo tanto, el presente estudio podría proporcionar información sobre un almacenamiento y transmisión de datos musicales más eficientes. Entrenamos generadores estocásticos y determinísticos en señales de audio comprimidas en MP3 con 16, 32 y 64 kbit/s. Realizamos una evaluación exhaustiva de los diferentes experimentos utilizando métricas objetivas y pruebas de escucha. Descubrimos que los modelos pueden mejorar la calidad de las señales de audio sobre las versiones MP3 para 16 y 32 kbit/s y que los generadores estocásticos son capaces de generar salidas que están más cerca de las señales originales que las de los generadores determinísticos.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro