Reformulando el enfoque de Máscara Binaria de Adress como Máscara Suave
Autores: de Fréin, Ruairí
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Reformulando el enfoque de Máscara Binaria de Adress como Máscara Suave
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Máscara binaria
Separación de fuentes
Fuentes musicales
Dominio tiempo-frecuencia
Algoritmo Redress
Algoritmo Adress
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
El enmascaramiento binario forma la base de varios enfoques de separación de fuentes que se han aplicado con éxito al problema de desmezclar fuentes musicales de una grabación estéreo. Un problema conocido con el enmascaramiento binario es que, cuando las fuentes musicales se superponen en el dominio tiempo-frecuencia, solo una de las fuentes superpuestas puede asignar la energía en un bin de tiempo-frecuencia particular. Para superar este problema, reformulamos el problema clásico de separación de fuentes de pan-pot para fuentes musicales como un programa cuadrático no negativo. Esta reformulación da lugar a un algoritmo, llamado Redress, que extiende el popular algoritmo Adress. Funciona definiendo una trayectoria de azimut para cada fuente basada en su posición espacial dentro del campo estéreo. Redress permite la asignación de energía en un bin de tiempo-frecuencia a múltiples fuentes. Presentamos resultados que muestran que para grabaciones musicales Redress mejora la relación señal-ruido (SNR), relación señal-artefacto (SAR) y relación señal-distorsión (SDR) en comparación con el algoritmo Adress.
Descripción
El enmascaramiento binario forma la base de varios enfoques de separación de fuentes que se han aplicado con éxito al problema de desmezclar fuentes musicales de una grabación estéreo. Un problema conocido con el enmascaramiento binario es que, cuando las fuentes musicales se superponen en el dominio tiempo-frecuencia, solo una de las fuentes superpuestas puede asignar la energía en un bin de tiempo-frecuencia particular. Para superar este problema, reformulamos el problema clásico de separación de fuentes de pan-pot para fuentes musicales como un programa cuadrático no negativo. Esta reformulación da lugar a un algoritmo, llamado Redress, que extiende el popular algoritmo Adress. Funciona definiendo una trayectoria de azimut para cada fuente basada en su posición espacial dentro del campo estéreo. Redress permite la asignación de energía en un bin de tiempo-frecuencia a múltiples fuentes. Presentamos resultados que muestran que para grabaciones musicales Redress mejora la relación señal-ruido (SNR), relación señal-artefacto (SAR) y relación señal-distorsión (SDR) en comparación con el algoritmo Adress.