Detección de demencia a partir del habla: ¿Qué pasa si los modelos de lenguaje no son la respuesta?

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Detección de demencia a partir del habla: ¿Qué pasa si los modelos de lenguaje no son la respuesta?

Autores: Bouazizi, Mondher; Zheng, Chuheng; Yang, Siyuan; Ohtsuki, Tomoaki

Idioma: Inglés

Editor: MDPI

Año: 2023

Acceso abierto

Artículo científico

2023

Detección de demencia a partir del habla: ¿Qué pasa si los modelos de lenguaje no son la respuesta?

Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Técnicas

Detección de demencia

Aprendizaje profundo

Procesamiento de lenguaje natural

Memoria a largo y corto plazo

Aumento de datos

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

Un enfoque creciente entre los científicos ha sido investigar las técnicas de detección automática de demencia que se pueden aplicar a las muestras de habla de individuos con demencia. Aprovechando los rápidos avances en Aprendizaje Profundo (DL) y Procesamiento de Lenguaje Natural (NLP), estas técnicas han mostrado un gran potencial en la detección de demencia. En este contexto, este artículo propone un método para la detección de demencia a partir del habla transcrita de los sujetos. A diferencia de los métodos convencionales que dependen de modelos de lenguaje avanzados para abordar la capacidad del sujeto para formar oraciones coherentes y significativas, nuestro enfoque se basa en el centro de atención de los sujetos y cómo cambia con el tiempo mientras el sujeto describe el contenido de la imagen del robo de galletas, una imagen comúnmente utilizada para evaluar las habilidades cognitivas de una persona. Para hacerlo, dividimos la imagen del robo de galletas en regiones de interés e identificamos, en cada oración pronunciada por el sujeto, qué regiones se están mencionando. Empleamos una red neuronal de Memoria a Largo y Corto Plazo (LSTM) para aprender diferentes patrones de sujetos con demencia y de control, y la utilizamos para realizar una clasificación basada en validación cruzada de 10 pliegues. Nuestros resultados experimentales en el corpus Pitt de DementiaBank resultaron en una precisión del 82.9% a nivel de sujeto y del 81.0% a nivel de muestra. Al emplear técnicas de aumento de datos, la precisión en ambos niveles se incrementó al 83.6% y al 82.1%, respectivamente. El rendimiento de nuestro método propuesto supera la mayoría de los métodos convencionales, que alcanzan, en el mejor de los casos, una precisión igual al 81.5% a nivel de sujeto.

Descripción

Un enfoque creciente entre los científicos ha sido investigar las técnicas de detección automática de demencia que se pueden aplicar a las muestras de habla de individuos con demencia. Aprovechando los rápidos avances en Aprendizaje Profundo (DL) y Procesamiento de Lenguaje Natural (NLP), estas técnicas han mostrado un gran potencial en la detección de demencia. En este contexto, este artículo propone un método para la detección de demencia a partir del habla transcrita de los sujetos. A diferencia de los métodos convencionales que dependen de modelos de lenguaje avanzados para abordar la capacidad del sujeto para formar oraciones coherentes y significativas, nuestro enfoque se basa en el centro de atención de los sujetos y cómo cambia con el tiempo mientras el sujeto describe el contenido de la imagen del robo de galletas, una imagen comúnmente utilizada para evaluar las habilidades cognitivas de una persona. Para hacerlo, dividimos la imagen del robo de galletas en regiones de interés e identificamos, en cada oración pronunciada por el sujeto, qué regiones se están mencionando. Empleamos una red neuronal de Memoria a Largo y Corto Plazo (LSTM) para aprender diferentes patrones de sujetos con demencia y de control, y la utilizamos para realizar una clasificación basada en validación cruzada de 10 pliegues. Nuestros resultados experimentales en el corpus Pitt de DementiaBank resultaron en una precisión del 82.9% a nivel de sujeto y del 81.0% a nivel de muestra. Al emplear técnicas de aumento de datos, la precisión en ambos niveles se incrementó al 83.6% y al 82.1%, respectivamente. El rendimiento de nuestro método propuesto supera la mayoría de los métodos convencionales, que alcanzan, en el mejor de los casos, una precisión igual al 81.5% a nivel de sujeto.

Otros recursos que podrían interesarte

Temas Virtualpro