Marco de aprendizaje automático híbrido para la clasificación de la enfermedad de Parkinson en múltiples etapas utilizando características acústicas de vocales coreanas sostenidas
Autores: Mondol, S. I. M. M. Raton; Kim, Ryul; Lee, Sangmin
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Marco de aprendizaje automático híbrido para la clasificación de la enfermedad de Parkinson en múltiples etapas utilizando características acústicas de vocales coreanas sostenidas
Categoría
Ingeniería y Tecnología
Subcategoría
Bioingeniería
Palabras clave
Investigación
Enfermedad de Parkinson
Disfonía
Algoritmos de clasificación
Aprendizaje automático
Características acústicas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 33
Citaciones: Sin citaciones
Investigaciones recientes han logrado una gran tasa de clasificación para separar a personas sanas de aquellas con la enfermedad de Parkinson (EP) utilizando el habla y la voz. Sin embargo, estos estudios han tratado principalmente las etapas tempranas y avanzadas de la EP como entidades iguales, descuidando los trastornos distintivos del habla y otros síntomas que varían a lo largo de las diferentes etapas de la enfermedad. Para abordar esta limitación y mejorar la precisión diagnóstica, este estudio evalúa las características acústicas seleccionadas de la disfonía, en relación con la EP y las etapas de Hoehn y Yahr, combinando diversas técnicas de preprocesamiento y múltiples algoritmos de clasificación, para crear una solución integral y robusta para tareas de clasificación. Las características de disfonía extraídas de las tres vocales coreanas sostenidas //(a), //(i) y //(u) exhiben diversidad y fuertes correlaciones. Para abordar este problema, se empleó el clasificador de selección de características del valor F de análisis de varianza de scikit-learn, para identificar las características relevantes más importantes. Además, para superar el problema de desequilibrio de clases, se utilizó la técnica de sobremuestreo sintético de minorías. Para garantizar comparaciones justas y mitigar la influencia de los clasificadores individuales, se emplearon cuatro clasificadores de aprendizaje automático comúnmente utilizados, a saber, bosque aleatorio (RF), máquina de vectores de soporte (SVM), vecino más cercano (kNN) y perceptrón multicapa (MLP). Este enfoque permite una evaluación integral de los métodos de extracción de características y minimiza la varianza en los modelos de clasificación finales. El pipeline híbrido de aprendizaje automático propuesto utilizando las características acústicas de las vocales sostenidas detecta eficientemente las etapas tempranas y de mediados-avanzadas de la EP con una precisión de detección del 95.48%, y con una precisión de detección del 86.62% para la clasificación de 4 etapas, y una precisión de detección del 89.48% para la clasificación de 3 etapas de la EP. Este estudio demuestra con éxito la importancia de utilizar las diversas características acústicas de la disfonía en la clasificación de la EP y sus etapas.
Descripción
Investigaciones recientes han logrado una gran tasa de clasificación para separar a personas sanas de aquellas con la enfermedad de Parkinson (EP) utilizando el habla y la voz. Sin embargo, estos estudios han tratado principalmente las etapas tempranas y avanzadas de la EP como entidades iguales, descuidando los trastornos distintivos del habla y otros síntomas que varían a lo largo de las diferentes etapas de la enfermedad. Para abordar esta limitación y mejorar la precisión diagnóstica, este estudio evalúa las características acústicas seleccionadas de la disfonía, en relación con la EP y las etapas de Hoehn y Yahr, combinando diversas técnicas de preprocesamiento y múltiples algoritmos de clasificación, para crear una solución integral y robusta para tareas de clasificación. Las características de disfonía extraídas de las tres vocales coreanas sostenidas //(a), //(i) y //(u) exhiben diversidad y fuertes correlaciones. Para abordar este problema, se empleó el clasificador de selección de características del valor F de análisis de varianza de scikit-learn, para identificar las características relevantes más importantes. Además, para superar el problema de desequilibrio de clases, se utilizó la técnica de sobremuestreo sintético de minorías. Para garantizar comparaciones justas y mitigar la influencia de los clasificadores individuales, se emplearon cuatro clasificadores de aprendizaje automático comúnmente utilizados, a saber, bosque aleatorio (RF), máquina de vectores de soporte (SVM), vecino más cercano (kNN) y perceptrón multicapa (MLP). Este enfoque permite una evaluación integral de los métodos de extracción de características y minimiza la varianza en los modelos de clasificación finales. El pipeline híbrido de aprendizaje automático propuesto utilizando las características acústicas de las vocales sostenidas detecta eficientemente las etapas tempranas y de mediados-avanzadas de la EP con una precisión de detección del 95.48%, y con una precisión de detección del 86.62% para la clasificación de 4 etapas, y una precisión de detección del 89.48% para la clasificación de 3 etapas de la EP. Este estudio demuestra con éxito la importancia de utilizar las diversas características acústicas de la disfonía en la clasificación de la EP y sus etapas.