logo móvil
Contáctanos

Mejora espectral independiente del hablante para el habla conducida por hueso

Autores: Cheng, Liangliang; Dou, Yunfeng; Zhou, Jian; Wang, Huabin; Tao, Liang

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Mejora espectral independiente del hablante para el habla conducida por hueso


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Software

Palabras clave

Características acústicas
Discurso conducido por hueso
Modelos de mejora del habla
Parte de alta frecuencia
Conjuntos de datos independientes del hablante
Método GANs

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 38

Citaciones: Sin citaciones


Descripción
Debido a las características acústicas del habla conducida por hueso (BC), el habla BC puede ser mejorada para comunicar de manera más efectiva en un entorno complejo con mucho ruido. Los modelos existentes de mejora del habla BC tienen una débil capacidad de recuperación espectral para la parte de alta frecuencia del habla BC y tienen una mejora deficiente y poca robustez para los conjuntos de datos de habla BC independientes del hablante. Para mejorar el efecto de mejora del habla BC para la mejora del habla independiente del hablante, utilizamos un método GANs para establecer el mapeo de características entre el habla BC y el habla conducida por aire (AC) para recuperar los componentes faltantes del habla BC. Además, el método agrega el entrenamiento del modelo de restricción de distancia espectral y, finalmente, utiliza el modelo mejorado completado por el entrenamiento para reconstruir el habla BC. Los resultados experimentales muestran que este método es superior a los métodos de comparación como CycleGAN, BLSTM, GMM y StarGAN en términos de mejora del habla BC independiente del hablante y puede obtener resultados de evaluación subjetiva y objetiva más altos del habla BC mejorada.

Otros recursos que podrían interesarte

Temas Virtualpro