Hacia un cribado de la enfermedad de Parkinson a través de la voz y el habla independiente del corpus (y del idioma) mediante la adaptación de dominio
Autores: Ibarra, Emiro J.; Arias-Londoño, Julián D.; Zañartu, Matías; Godino-Llorente, Juan I.
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Hacia un cribado de la enfermedad de Parkinson a través de la voz y el habla independiente del corpus (y del idioma) mediante la adaptación de dominio
Categoría
Ingeniería y Tecnología
Subcategoría
Bioingeniería
Palabras clave
Modelos de aprendizaje profundo
Enfermedad de Parkinson
Voz
Habla
Entrenamiento adversarial de dominio
Modelos independientes del corpus
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Los modelos de aprendizaje profundo de extremo a extremo han mostrado resultados prometedores para la detección automática de la enfermedad de Parkinson por voz y habla. Sin embargo, estos modelos a menudo sufren degradación en su rendimiento cuando se aplican a escenarios que involucran múltiples corpora. Además, también muestran agrupaciones dependientes del corpus. Estos hechos indican una falta de generalización o la presencia de ciertos atajos en la decisión, y también sugieren la necesidad de desarrollar nuevos modelos independientes del corpus. En este sentido, este trabajo explora el uso del entrenamiento adversarial de dominio como una estrategia viable para desarrollar modelos que conserven su capacidad discriminativa para detectar la enfermedad de Parkinson en diversos conjuntos de datos. El documento presenta tres arquitecturas de aprendizaje profundo y sus contrapartes adversariales de dominio. Los modelos fueron evaluados con grabaciones de vocales sostenidas y diadococinéticas extraídas de cuatro corpora con diferentes características demográficas, dialectos o idiomas, y condiciones de grabación. Los resultados mostraron que la distribución espacial de las características de incrustación extraídas por las redes adversariales de dominio exhibe una mayor cohesión intraclase. Este comportamiento está respaldado por una disminución en la variabilidad y la divergencia entre dominios calculada dentro de cada clase. Los hallazgos sugieren que las redes adversariales de dominio son capaces de aprender las características comunes presentes en la voz y el habla parkinsonianos, que se supone son independientes del corpus y, en consecuencia, del idioma. En general, este esfuerzo proporciona evidencia de que las técnicas de adaptación de dominio refinan los enfoques existentes de aprendizaje profundo de extremo a extremo para la detección de la enfermedad de Parkinson a partir de la voz y el habla, logrando modelos más generalizables.
Descripción
Los modelos de aprendizaje profundo de extremo a extremo han mostrado resultados prometedores para la detección automática de la enfermedad de Parkinson por voz y habla. Sin embargo, estos modelos a menudo sufren degradación en su rendimiento cuando se aplican a escenarios que involucran múltiples corpora. Además, también muestran agrupaciones dependientes del corpus. Estos hechos indican una falta de generalización o la presencia de ciertos atajos en la decisión, y también sugieren la necesidad de desarrollar nuevos modelos independientes del corpus. En este sentido, este trabajo explora el uso del entrenamiento adversarial de dominio como una estrategia viable para desarrollar modelos que conserven su capacidad discriminativa para detectar la enfermedad de Parkinson en diversos conjuntos de datos. El documento presenta tres arquitecturas de aprendizaje profundo y sus contrapartes adversariales de dominio. Los modelos fueron evaluados con grabaciones de vocales sostenidas y diadococinéticas extraídas de cuatro corpora con diferentes características demográficas, dialectos o idiomas, y condiciones de grabación. Los resultados mostraron que la distribución espacial de las características de incrustación extraídas por las redes adversariales de dominio exhibe una mayor cohesión intraclase. Este comportamiento está respaldado por una disminución en la variabilidad y la divergencia entre dominios calculada dentro de cada clase. Los hallazgos sugieren que las redes adversariales de dominio son capaces de aprender las características comunes presentes en la voz y el habla parkinsonianos, que se supone son independientes del corpus y, en consecuencia, del idioma. En general, este esfuerzo proporciona evidencia de que las técnicas de adaptación de dominio refinan los enfoques existentes de aprendizaje profundo de extremo a extremo para la detección de la enfermedad de Parkinson a partir de la voz y el habla, logrando modelos más generalizables.