Método de Mejora del Habla en Control de Tráfico Aéreo Basado en DNN-IRM Mejorado
Autores: Wu, Yuezhou; Li, Pengfei; Zhang, Siling
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Método de Mejora del Habla en Control de Tráfico Aéreo Basado en DNN-IRM Mejorado
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Control de tráfico aéreo
Calidad del habla
Interferencia de ruido
DNN-IRM
LeakyReLU
Mejora del habla
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
La calidad del habla en el control del tráfico aéreo es crucial. Sin embargo, el ruido interno y externo puede afectar la calidad del habla en el control del tráfico aéreo. Instrucciones de habla claras y retroalimentación ayudan a optimizar los procesos de vuelo y las respuestas a emergencias. El método tradicional de mejora del habla basado en una red neuronal profunda y una máscara de relación ideal (DNN-IRM) es propenso a la distorsión del habla objetivo en un entorno de ruido fuerte. Este artículo presenta un método de mejora del habla en el control del tráfico aéreo basado en un DNN-IRM mejorado. Emplea LeakyReLU como función de activación para aliviar el problema de desvanecimiento del gradiente, mejora la estructura de la red DNN para aumentar la capacidad de estimación de la IRM y ajusta los pesos de la IRM para reducir la interferencia del ruido en el habla objetivo. Los resultados experimentales muestran que, en comparación con otros métodos, este método mejora la evaluación perceptual de la calidad del habla (PESQ), la inteligibilidad objetiva a corto plazo (STOI), la relación señal-ruido invariante a la escala (SI-SNR) y la claridad del espectrograma del habla. Además, utilizamos este método para mejorar el habla real del control del tráfico aéreo, y la calidad del habla también se mejora.
Descripción
La calidad del habla en el control del tráfico aéreo es crucial. Sin embargo, el ruido interno y externo puede afectar la calidad del habla en el control del tráfico aéreo. Instrucciones de habla claras y retroalimentación ayudan a optimizar los procesos de vuelo y las respuestas a emergencias. El método tradicional de mejora del habla basado en una red neuronal profunda y una máscara de relación ideal (DNN-IRM) es propenso a la distorsión del habla objetivo en un entorno de ruido fuerte. Este artículo presenta un método de mejora del habla en el control del tráfico aéreo basado en un DNN-IRM mejorado. Emplea LeakyReLU como función de activación para aliviar el problema de desvanecimiento del gradiente, mejora la estructura de la red DNN para aumentar la capacidad de estimación de la IRM y ajusta los pesos de la IRM para reducir la interferencia del ruido en el habla objetivo. Los resultados experimentales muestran que, en comparación con otros métodos, este método mejora la evaluación perceptual de la calidad del habla (PESQ), la inteligibilidad objetiva a corto plazo (STOI), la relación señal-ruido invariante a la escala (SI-SNR) y la claridad del espectrograma del habla. Además, utilizamos este método para mejorar el habla real del control del tráfico aéreo, y la calidad del habla también se mejora.