Mejora de discurso basada en transformada de onda empírica mejorada y operador de energía Teager
Autores: Kuwaek, Piotr; Jko, Waldemar
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Mejora de discurso basada en transformada de onda empírica mejorada y operador de energía Teager
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Enfoque propuesto: mejora del habla
Transformada wavelet empírica
Umbrales
Señales de componentes individuales
Nivel de ruido
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
Este documento presenta un nuevo enfoque de mejora del habla basado en una transformada de ondícula empírica mejorada, considerando la adaptación en tiempo y escala de los umbrales para las señales de componentes individuales obtenidas de la transformada utilizada. La adaptación en tiempo se realiza utilizando el operador de energía Teager en las señales de componentes individuales, y la adaptación de escala de umbrales se realiza mediante el principio modificado de umbral dependiente del nivel para las señales de componentes individuales. El enfoque propuesto no requiere una estimación explícita del nivel de ruido o un conocimiento a priori de la relación señal-ruido como suele ser necesario en la mayoría de los métodos comunes de mejora del habla. La efectividad del método propuesto ha sido evaluada basándose en más de 1000 grabaciones de habla de la base de datos pública Librispeech. La investigación incluyó varios tipos de ruido (entre otros, blanco, violeta, marrón, azul y rosa) y varios tipos de perturbaciones (entre otros, sonidos de tráfico, secador de pelo y ventilador), que se añadieron a las señales de prueba seleccionadas. La puntuación de la evaluación perceptual de la calidad del habla, que permite la evaluación de la calidad del habla mejorada, y la relación señal-ruido, que permite la evaluación de la efectividad de la atenuación de la perturbación, se seleccionan para la evaluación de la efectividad resultante del enfoque propuesto. La efectividad resultante del enfoque propuesto se compara con otros métodos de mejora del habla seleccionados o técnicas de reducción de ruido disponibles en la literatura. Los resultados de la investigación experimental muestran que el método propuesto funciona mejor que los métodos convencionales en muchos tipos de condiciones de alto ruido en términos de producir menos ruido residual y menor distorsión del habla.
Descripción
Este documento presenta un nuevo enfoque de mejora del habla basado en una transformada de ondícula empírica mejorada, considerando la adaptación en tiempo y escala de los umbrales para las señales de componentes individuales obtenidas de la transformada utilizada. La adaptación en tiempo se realiza utilizando el operador de energía Teager en las señales de componentes individuales, y la adaptación de escala de umbrales se realiza mediante el principio modificado de umbral dependiente del nivel para las señales de componentes individuales. El enfoque propuesto no requiere una estimación explícita del nivel de ruido o un conocimiento a priori de la relación señal-ruido como suele ser necesario en la mayoría de los métodos comunes de mejora del habla. La efectividad del método propuesto ha sido evaluada basándose en más de 1000 grabaciones de habla de la base de datos pública Librispeech. La investigación incluyó varios tipos de ruido (entre otros, blanco, violeta, marrón, azul y rosa) y varios tipos de perturbaciones (entre otros, sonidos de tráfico, secador de pelo y ventilador), que se añadieron a las señales de prueba seleccionadas. La puntuación de la evaluación perceptual de la calidad del habla, que permite la evaluación de la calidad del habla mejorada, y la relación señal-ruido, que permite la evaluación de la efectividad de la atenuación de la perturbación, se seleccionan para la evaluación de la efectividad resultante del enfoque propuesto. La efectividad resultante del enfoque propuesto se compara con otros métodos de mejora del habla seleccionados o técnicas de reducción de ruido disponibles en la literatura. Los resultados de la investigación experimental muestran que el método propuesto funciona mejor que los métodos convencionales en muchos tipos de condiciones de alto ruido en términos de producir menos ruido residual y menor distorsión del habla.