Un algoritmo de IVA basado en Expectativa-Maximización para la separación de fuentes de habla utilizando un modelo de mezcla de t de Student como priors de fuente
Autores: Rafique, Waqas; Chambers, Jonathon; Sunny, Ali Imam
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Un algoritmo de IVA basado en Expectativa-Maximización para la separación de fuentes de habla utilizando un modelo de mezcla de t de Student como priors de fuente
Categoría
Artes
Subcategoría
Música
Palabras clave
Rendimiento
Análisis de vectores independientes
Algoritmo IVA
Prior de fuente
Señales de voz
Propiedades estadísticas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
El rendimiento del algoritmo de análisis de vectores independientes (IVA) depende de la elección de la fuente previa para modelar mejor las señales de voz, ya que emplea una fuente previa multivariante para mantener la dependencia entre los bins de frecuencia de cada fuente. Frecuentemente se utilizan fuentes previas idénticas para los métodos IVA; sin embargo, diferentes fuentes de voz generalmente tendrán diferentes propiedades estadísticas. En este trabajo, en lugar de fuentes previas idénticas, se introduce un modelo de mezcla de t de Student basado en la fuente previa para el algoritmo IVA que puede adaptarse a las propiedades estadísticas de diferentes fuentes de voz y, por lo tanto, mejorar el rendimiento de separación del algoritmo IVA. Los parámetros desconocidos de la fuente previa y las matrices de separación se estiman conjuntamente mediante la derivación de un eficiente algoritmo de maximización de la expectativa (EM). Se confirma una mejora útil en el rendimiento de separación en diferentes escenarios realistas mediante estudios experimentales en conjuntos de datos reales.
Descripción
El rendimiento del algoritmo de análisis de vectores independientes (IVA) depende de la elección de la fuente previa para modelar mejor las señales de voz, ya que emplea una fuente previa multivariante para mantener la dependencia entre los bins de frecuencia de cada fuente. Frecuentemente se utilizan fuentes previas idénticas para los métodos IVA; sin embargo, diferentes fuentes de voz generalmente tendrán diferentes propiedades estadísticas. En este trabajo, en lugar de fuentes previas idénticas, se introduce un modelo de mezcla de t de Student basado en la fuente previa para el algoritmo IVA que puede adaptarse a las propiedades estadísticas de diferentes fuentes de voz y, por lo tanto, mejorar el rendimiento de separación del algoritmo IVA. Los parámetros desconocidos de la fuente previa y las matrices de separación se estiman conjuntamente mediante la derivación de un eficiente algoritmo de maximización de la expectativa (EM). Se confirma una mejora útil en el rendimiento de separación en diferentes escenarios realistas mediante estudios experimentales en conjuntos de datos reales.