logo móvil
Contáctanos

Mejorando la detección de mala pronunciación de palabras en árabe para estudiantes no nativos utilizando características de red neuronal convolucional profunda

Autores: Akhtar, Shamila; Hussain, Fawad; Raja, Fawad Riasat; Ehatisham-ul-haq, Muhammad; Baloch, Naveed Khan; Ishmanov, Farruh; Zikria, Yousaf Bin

Idioma: Inglés

Editor: MDPI

Año: 2020

Descargar PDF

Acceso abierto

Artículo científico
2020

Mejorando la detección de mala pronunciación de palabras en árabe para estudiantes no nativos utilizando características de red neuronal convolucional profunda


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Aprendizaje de idiomas asistido por computadora
Detección de pronunciación incorrecta
Palabras árabes
Red neuronal convolucional profunda
Clasificadores de aprendizaje automático
Modelo basado en transferencia de aprendizaje

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 38

Citaciones: Sin citaciones


Descripción
El Aprendizaje de Idiomas Asistido por Computadora (CALL) está creciendo en la actualidad porque aprender nuevos idiomas es esencial para comunicarse con personas de diferentes antecedentes lingüísticos. La detección de pronunciación incorrecta es una parte integral de CALL, que se utiliza para señalar automáticamente errores para el hablante no nativo. En este artículo, investigamos la detección de pronunciación incorrecta de palabras árabes utilizando una Red Neuronal Convolucional profunda (CNN). Para la detección automatizada de errores de pronunciación, propusimos un modelo basado en características de CNN y extraímos características de diferentes capas de Alex Net (capas 6, 7 y 8) para entrenar tres clasificadores de aprendizaje automático; vecino más cercano (KNN), Máquina de Vectores de Soporte (SVM) y Bosque Aleatorio (RF). También utilizamos un modelo basado en aprendizaje por transferencia en el que la extracción de características y la clasificación se realizan automáticamente. Para evaluar el rendimiento del método propuesto, se proporciona una evaluación exhaustiva de estos métodos con un método basado en aprendizaje automático tradicional que utiliza características de Coeficientes Cepstrales de Frecuencia Melódica (MFCC). Utilizamos los mismos tres clasificadores KNN, SVM y RF en el método de referencia para la detección de pronunciación incorrecta. Los resultados experimentales muestran que con características hechas a mano, el método basado en aprendizaje por transferencia y la clasificación basada en características profundas extraídas de Alex Net lograron una precisión promedio de 73.67, 85 y 93.20 en palabras árabes, respectivamente. Además, estos resultados revelan que el método propuesto con selección de características logró la mejor precisión promedio de 93.20% que todos los demás métodos.

Otros recursos que podrían interesarte

Temas Virtualpro