Evaluación de la Carga Cognitiva de Controladores de Tráfico Aéreo Basada en la Red SCNN-TransE Utilizando Datos de Voz
Autores: Yang, Jing; Yang, Hongyu; Wu, Zhengyuan; Wu, Xiping
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Evaluación de la Carga Cognitiva de Controladores de Tráfico Aéreo Basada en la Red SCNN-TransE Utilizando Datos de Voz
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Controladores de tráfico aéreo
Métodos de evaluación de carga cognitiva
Parámetros del habla
Espectrograma de Mel
Red neuronal convolucional
Codificador Transformer
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 18
Citaciones: Sin citaciones
Debido al aumento del flujo de tráfico aéreo, los controladores de tráfico aéreo (ATC) operan en un estado de alta carga o incluso sobrecarga durante largos períodos de tiempo, lo que puede afectar seriamente la fiabilidad y eficiencia de los comandos de los controladores. Por lo tanto, la identificación temprana de los ATC que están sobrecargados es crucial para el mantenimiento de la seguridad de los vuelos mientras se aumenta la eficiencia general de los vuelos. Este estudio utiliza una comparación exhaustiva de los métodos existentes de evaluación de carga cognitiva combinados con las características del ATC como base para proponer un método para la utilización de parámetros de voz para evaluar la carga cognitiva. Este método se selecciona en última instancia debido a la mínima interferencia del equipo de recolección y la abundancia de señales de voz. La señal de voz se preprocesa para generar un espectrograma de Mel, que contiene información temporal además de energía, tono y otra información espacial. Por lo tanto, se propone un modelo de evaluación de carga cognitiva de voz basado en una red neuronal convolucional apilada (CNN) y el codificador Transformer (SCNN-TransE). El uso de una CNN y el codificador Transformer nos permite extraer características espaciales y características temporales, respectivamente, de la información contextual de los datos de voz y facilita la fusión de características espaciales y características temporales en características espaciotemporales, lo que mejora la capacidad de nuestro método para capturar las características profundas de la voz. Realizamos experimentos con datos de comunicación de control de tráfico aéreo, que muestran que la precisión de detección y la puntuación F1 de SCNN-TransE son mejores que los resultados de los modelos de máquina de soporte vectorial (SVM), k-vecinos más cercanos (KNN), bosque aleatorio (RF), aumento adaptativo (AdaBoost) y memoria a largo plazo paralela de CNN apilada con atención (SCNN-LSTM-Attention), alcanzando valores de 97.48% y 97.07%, respectivamente. Por lo tanto, nuestro modelo propuesto puede realizar la evaluación efectiva de los niveles de carga cognitiva.
Descripción
Debido al aumento del flujo de tráfico aéreo, los controladores de tráfico aéreo (ATC) operan en un estado de alta carga o incluso sobrecarga durante largos períodos de tiempo, lo que puede afectar seriamente la fiabilidad y eficiencia de los comandos de los controladores. Por lo tanto, la identificación temprana de los ATC que están sobrecargados es crucial para el mantenimiento de la seguridad de los vuelos mientras se aumenta la eficiencia general de los vuelos. Este estudio utiliza una comparación exhaustiva de los métodos existentes de evaluación de carga cognitiva combinados con las características del ATC como base para proponer un método para la utilización de parámetros de voz para evaluar la carga cognitiva. Este método se selecciona en última instancia debido a la mínima interferencia del equipo de recolección y la abundancia de señales de voz. La señal de voz se preprocesa para generar un espectrograma de Mel, que contiene información temporal además de energía, tono y otra información espacial. Por lo tanto, se propone un modelo de evaluación de carga cognitiva de voz basado en una red neuronal convolucional apilada (CNN) y el codificador Transformer (SCNN-TransE). El uso de una CNN y el codificador Transformer nos permite extraer características espaciales y características temporales, respectivamente, de la información contextual de los datos de voz y facilita la fusión de características espaciales y características temporales en características espaciotemporales, lo que mejora la capacidad de nuestro método para capturar las características profundas de la voz. Realizamos experimentos con datos de comunicación de control de tráfico aéreo, que muestran que la precisión de detección y la puntuación F1 de SCNN-TransE son mejores que los resultados de los modelos de máquina de soporte vectorial (SVM), k-vecinos más cercanos (KNN), bosque aleatorio (RF), aumento adaptativo (AdaBoost) y memoria a largo plazo paralela de CNN apilada con atención (SCNN-LSTM-Attention), alcanzando valores de 97.48% y 97.07%, respectivamente. Por lo tanto, nuestro modelo propuesto puede realizar la evaluación efectiva de los niveles de carga cognitiva.