Detección de demencia a partir del habla: ¿Qué pasa si los modelos de lenguaje no son la respuesta?
Autores: Bouazizi, Mondher; Zheng, Chuheng; Yang, Siyuan; Ohtsuki, Tomoaki
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Detección de demencia a partir del habla: ¿Qué pasa si los modelos de lenguaje no son la respuesta?
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Técnicas
Detección de demencia
Aprendizaje profundo
Procesamiento de lenguaje natural
Memoria a largo y corto plazo
Aumento de datos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Un enfoque creciente entre los científicos ha sido investigar las técnicas de detección automática de demencia que se pueden aplicar a las muestras de habla de individuos con demencia. Aprovechando los rápidos avances en Aprendizaje Profundo (DL) y Procesamiento de Lenguaje Natural (NLP), estas técnicas han mostrado un gran potencial en la detección de demencia. En este contexto, este artículo propone un método para la detección de demencia a partir del habla transcrita de los sujetos. A diferencia de los métodos convencionales que dependen de modelos de lenguaje avanzados para abordar la capacidad del sujeto para formar oraciones coherentes y significativas, nuestro enfoque se basa en el centro de atención de los sujetos y cómo cambia con el tiempo mientras el sujeto describe el contenido de la imagen del robo de galletas, una imagen comúnmente utilizada para evaluar las habilidades cognitivas de una persona. Para hacerlo, dividimos la imagen del robo de galletas en regiones de interés e identificamos, en cada oración pronunciada por el sujeto, qué regiones se están mencionando. Empleamos una red neuronal de Memoria a Largo y Corto Plazo (LSTM) para aprender diferentes patrones de sujetos con demencia y de control, y la utilizamos para realizar una clasificación basada en validación cruzada de 10 pliegues. Nuestros resultados experimentales en el corpus Pitt de DementiaBank resultaron en una precisión del 82.9% a nivel de sujeto y del 81.0% a nivel de muestra. Al emplear técnicas de aumento de datos, la precisión en ambos niveles se incrementó al 83.6% y al 82.1%, respectivamente. El rendimiento de nuestro método propuesto supera la mayoría de los métodos convencionales, que alcanzan, en el mejor de los casos, una precisión igual al 81.5% a nivel de sujeto.
Descripción
Un enfoque creciente entre los científicos ha sido investigar las técnicas de detección automática de demencia que se pueden aplicar a las muestras de habla de individuos con demencia. Aprovechando los rápidos avances en Aprendizaje Profundo (DL) y Procesamiento de Lenguaje Natural (NLP), estas técnicas han mostrado un gran potencial en la detección de demencia. En este contexto, este artículo propone un método para la detección de demencia a partir del habla transcrita de los sujetos. A diferencia de los métodos convencionales que dependen de modelos de lenguaje avanzados para abordar la capacidad del sujeto para formar oraciones coherentes y significativas, nuestro enfoque se basa en el centro de atención de los sujetos y cómo cambia con el tiempo mientras el sujeto describe el contenido de la imagen del robo de galletas, una imagen comúnmente utilizada para evaluar las habilidades cognitivas de una persona. Para hacerlo, dividimos la imagen del robo de galletas en regiones de interés e identificamos, en cada oración pronunciada por el sujeto, qué regiones se están mencionando. Empleamos una red neuronal de Memoria a Largo y Corto Plazo (LSTM) para aprender diferentes patrones de sujetos con demencia y de control, y la utilizamos para realizar una clasificación basada en validación cruzada de 10 pliegues. Nuestros resultados experimentales en el corpus Pitt de DementiaBank resultaron en una precisión del 82.9% a nivel de sujeto y del 81.0% a nivel de muestra. Al emplear técnicas de aumento de datos, la precisión en ambos niveles se incrementó al 83.6% y al 82.1%, respectivamente. El rendimiento de nuestro método propuesto supera la mayoría de los métodos convencionales, que alcanzan, en el mejor de los casos, una precisión igual al 81.5% a nivel de sujeto.