logo móvil
Contáctanos

Hacia una detección efectiva de los signos de llamada de aeronaves utilizando coincidencia de cadenas difusas entre datos de ASR y ADS-B

Autores: Kasttet, Mohammed Saïd; Lyhyaoui, Abdelouahid; Zbakh, Douae; Aramja, Adil; Kachkari, Abderazzek

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Hacia una detección efectiva de los signos de llamada de aeronaves utilizando coincidencia de cadenas difusas entre datos de ASR y ADS-B


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Aeroespacial

Palabras clave

Inteligencia artificial
Ciencia de datos
Reconocimiento Automático de Voz
Modelos Ocultos de Markov
Redes Neuronales Profundas
Red Neuronal Recurrente

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 32

Citaciones: Sin citaciones


Descripción
Recientemente, la inteligencia artificial y la ciencia de datos han sido testigos de un progreso dramático y un crecimiento rápido, especialmente en la tecnología de Reconocimiento Automático de Voz (ASR) basada en Modelos Ocultos de Markov (HMM) y Redes Neuronales Profundas (DNN). En consecuencia, se desarrollaron nuevos kits de herramientas de Redes Neuronales Recurrentes (RNN) de extremo a extremo con mayor velocidad y precisión que a menudo pueden lograr una Tasa de Error de Palabras (WER) por debajo del 10%. Estos kits de herramientas pueden ser desplegados hoy en día, por ejemplo, dentro de las cabinas de aviones y sistemas de Control de Tráfico Aéreo (ATC) para identificar aeronaves y mostrar mensajes de voz reconocidos relacionados con datos de vuelo, especialmente para aeropuertos no equipados con radar. Por lo tanto, el rendimiento de los controladores de tráfico aéreo y los pilotos puede mejorar en última instancia al reducir la carga de trabajo y el estrés y hacer cumplir los estándares de seguridad. Nuestro experimento realizado en el ATC del Aeropuerto Internacional de Tánger tenía como objetivo construir un modelo ASR capaz de reconocer las señales de llamada de las aeronaves de manera rápida y precisa. Los modelos acústicos y lingüísticos fueron entrenados en el Corpus de Voz Ibn Battouta (IBSC), resultando en un conjunto de datos de voz sin precedentes con transcripción aprobada que incluye datos reales de observación meteorológica del aeródromo e información de vuelo con una señal de llamada capturada por un receptor ADS-B. Todos estos datos fueron sincronizados con grabaciones de voz en un formato estructurado. Calculamos la WER para evaluar la precisión del modelo y comparamos diferentes métodos de entrenamiento de conjuntos de datos para la construcción y adaptación del modelo. A pesar de la alta interferencia en el canal de comunicación de radio VHF y las condiciones de habla rápida que aumentaron el nivel de WER al 20%, nuestro sistema ASR independiente y de bajo costo con un modelo RNN entrenado, respaldado por el kit de herramientas Deep Speech, pudo lograr tasas de detección de señales de llamada de hasta el 96% en los mensajes de los controladores de tráfico aéreo y del 90% en los mensajes de los pilotos mientras mostraba información de vuelo relacionada a partir de datos ADS-B utilizando el algoritmo de coincidencia de cadenas difusas.

Otros recursos que podrían interesarte

Temas Virtualpro