Un Agente Piloto de Simulación Virtual para la Capacitación de Controladores de Tráfico Aéreo
Autores: Zuluaga-Gomez, Juan; Prasad, Amrutha; Nigmatulina, Iuliia; Motlicek, Petr; Kleinert, Matthias
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un Agente Piloto de Simulación Virtual para la Capacitación de Controladores de Tráfico Aéreo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Propuesto
Simulación virtual-motor piloto
Controlador de tráfico aéreo
Inteligencia artificial
Reconocimiento de voz
Generador de respuestas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
En este artículo proponemos un novedoso motor de simulación virtual-piloto para acelerar la formación de controladores de tráfico aéreo (ATCo) mediante la integración de diferentes herramientas de inteligencia artificial (IA) de última generación. El motor de simulación virtual-piloto recibe comunicaciones habladas de los aprendices de ATCo y realiza reconocimiento y comprensión automática del habla. Así, va más allá de simplemente transcribir la comunicación y también puede entender su significado. La salida se envía posteriormente a un sistema generador de respuestas, que se asemeja a la repetición hablada que los pilotos dan a los aprendices de ATCo. El flujo general está compuesto por los siguientes submódulos: (i) un sistema de reconocimiento automático del habla (ASR) que transforma audio en una secuencia de palabras; (ii) un analizador de entidades relacionadas con el control del tráfico aéreo (ATC) de alto nivel que entiende la comunicación de voz transcrita; y (iii) un submódulo de texto a voz que genera una expresión hablada que se asemeja a un piloto según la situación del diálogo. Nuestro sistema emplea herramientas de IA de última generación como Wav2Vec 2.0, Conformer, BERT y modelos Tacotron. Hasta donde sabemos, este es el primer trabajo completamente basado en recursos de ATC de código abierto y herramientas de IA. Además, desarrollamos un sistema robusto y modular con submódulos opcionales que pueden mejorar el rendimiento del sistema al incorporar datos de vigilancia en tiempo real, metadatos relacionados con ejercicios (como sectores o pistas), o incluso un error deliberado en la repetición para entrenar a los aprendices de ATCo a identificarlos. Nuestro sistema ASR puede alcanzar tasas de error absoluto de palabras (WER) tan bajas como 5.5% y 15.9% en audio de ATC de alta y baja calidad. También demostramos que agregar datos de vigilancia al ASR puede lograr una precisión de detección de indicativos de más del 96%.
Descripción
En este artículo proponemos un novedoso motor de simulación virtual-piloto para acelerar la formación de controladores de tráfico aéreo (ATCo) mediante la integración de diferentes herramientas de inteligencia artificial (IA) de última generación. El motor de simulación virtual-piloto recibe comunicaciones habladas de los aprendices de ATCo y realiza reconocimiento y comprensión automática del habla. Así, va más allá de simplemente transcribir la comunicación y también puede entender su significado. La salida se envía posteriormente a un sistema generador de respuestas, que se asemeja a la repetición hablada que los pilotos dan a los aprendices de ATCo. El flujo general está compuesto por los siguientes submódulos: (i) un sistema de reconocimiento automático del habla (ASR) que transforma audio en una secuencia de palabras; (ii) un analizador de entidades relacionadas con el control del tráfico aéreo (ATC) de alto nivel que entiende la comunicación de voz transcrita; y (iii) un submódulo de texto a voz que genera una expresión hablada que se asemeja a un piloto según la situación del diálogo. Nuestro sistema emplea herramientas de IA de última generación como Wav2Vec 2.0, Conformer, BERT y modelos Tacotron. Hasta donde sabemos, este es el primer trabajo completamente basado en recursos de ATC de código abierto y herramientas de IA. Además, desarrollamos un sistema robusto y modular con submódulos opcionales que pueden mejorar el rendimiento del sistema al incorporar datos de vigilancia en tiempo real, metadatos relacionados con ejercicios (como sectores o pistas), o incluso un error deliberado en la repetición para entrenar a los aprendices de ATCo a identificarlos. Nuestro sistema ASR puede alcanzar tasas de error absoluto de palabras (WER) tan bajas como 5.5% y 15.9% en audio de ATC de alta y baja calidad. También demostramos que agregar datos de vigilancia al ASR puede lograr una precisión de detección de indicativos de más del 96%.