Un nuevo esquema para la dereverberación de voz de canal único
Autores: Kilis, Nikolaos; Mitianoudis, Nikolaos
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Un nuevo esquema para la dereverberación de voz de canal único
Categoría
Artes
Subcategoría
Música
Palabras clave
Esquema novedoso
Des-reverberación de voz
De dos etapas y un solo canal
Búsqueda de coincidencias ortogonales
Algoritmo K-SVD
Estimación de reverberación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
Este artículo presenta un esquema novedoso para la dereverberación del habla. El núcleo de nuestro método es un esquema de mejora del habla de un solo canal en dos etapas. El habla degradada obtiene una representación más escasa del residuo de predicción lineal en la primera etapa de nuestro esquema propuesto al aplicar la búsqueda de coincidencias ortogonales en bases sobrecompletas, entrenadas por el algoritmo K-SVD. Nuestro método incluye una estimación del tiempo de reverberación y mezcla a partir de un aplauso grabado o una respuesta al impulso de sala simulada, que se utilizan para crear un envolvente en el dominio del tiempo. La reverberación tardía se suprime en la segunda etapa al estimar su energía a partir del envolvente anterior y se elimina con sustracción espectral. Se aplica una mejora adicional del habla para minimizar el ruido de fondo, basada en suavizado óptimo y estadísticas mínimas. Los resultados experimentales indican una calidad favorable, en comparación con dos métodos de vanguardia, especialmente en entornos reverberantes reales con mayor reverberación y ruido de fondo.
Descripción
Este artículo presenta un esquema novedoso para la dereverberación del habla. El núcleo de nuestro método es un esquema de mejora del habla de un solo canal en dos etapas. El habla degradada obtiene una representación más escasa del residuo de predicción lineal en la primera etapa de nuestro esquema propuesto al aplicar la búsqueda de coincidencias ortogonales en bases sobrecompletas, entrenadas por el algoritmo K-SVD. Nuestro método incluye una estimación del tiempo de reverberación y mezcla a partir de un aplauso grabado o una respuesta al impulso de sala simulada, que se utilizan para crear un envolvente en el dominio del tiempo. La reverberación tardía se suprime en la segunda etapa al estimar su energía a partir del envolvente anterior y se elimina con sustracción espectral. Se aplica una mejora adicional del habla para minimizar el ruido de fondo, basada en suavizado óptimo y estadísticas mínimas. Los resultados experimentales indican una calidad favorable, en comparación con dos métodos de vanguardia, especialmente en entornos reverberantes reales con mayor reverberación y ruido de fondo.