Identificando probable demencia en estadounidenses negros y blancos no diagnosticados utilizando aprendizaje automático en registros de salud electrónicos de la Administración de Salud de Veteranos
Autores: Shao, Yijun; Todd, Kaitlin; Shutes-David, Andrew; Millard, Steven P.; Brown, Karl; Thomas, Amy; Chen, Kathryn; Wilson, Katherine; Zeng, Qing T.; Tsuang, Debby W.
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Identificando probable demencia en estadounidenses negros y blancos no diagnosticados utilizando aprendizaje automático en registros de salud electrónicos de la Administración de Salud de Veteranos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Procesamiento del lenguaje natural
Aprendizaje automático
Registros electrónicos de salud
Demencia
Afroamericanos
Máquina de vectores de soporte
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 49
Citaciones: Sin citaciones
La aplicación del procesamiento del lenguaje natural y del aprendizaje automático (ML) en los registros de salud electrónicos (EHRs) puede ayudar a reducir el subdiagnóstico de demencia, pero los modelos que no están diseñados para reflejar a las poblaciones minoritarias pueden en cambio perpetuar el subdiagnóstico. Para mejorar la identificación de la demencia no diagnosticada, especialmente en los afroamericanos (AAs), desarrollamos modelos de ML de máquinas de vectores de soporte (SVM) para asignar puntuaciones de riesgo de demencia basadas en características identificadas en datos no estructurados de EHR (a través de la asignación de Dirichlet latente y la extracción de temas estables en n = 1 M notas) y datos estructurados de EHR. Hipotetizamos que los modelos separados mostrarían diferenciación entre los grupos raciales, por lo que los modelos se ajustaron por separado para los AAs (n = 5 K con códigos de demencia, n = 5 K sin ellos) y para los estadounidenses blancos (WAs; n = 5 K con códigos, n = 5 K sin ellos). Para validar nuestro método, se generaron puntuaciones para muestras separadas de AAs (n = 10 K) y WAs (n = 10 K) sin códigos de demencia, y los EHR de 1.2 K de estos pacientes fueron revisados por expertos en demencia. Todos los sujetos tenían 65 años o más y provenían de la VA, lo que significaba que las muestras eran desproporcionadamente masculinas. Se observó una relación positiva fuerte entre las puntuaciones de riesgo generadas por SVM y la demencia no diagnosticada. Los AAs tenían más probabilidades que los WAs de tener demencia no diagnosticada según la revisión de historiales clínicos, tanto en general (15.3% vs. 9.5%) como entre los veteranos con puntuaciones de corte >90º percentil (25.6% vs. 15.3%). Con las revisiones de historiales clínicos como estándar de referencia y diferentes puntuaciones de corte, el modelo de AA tuvo un rendimiento ligeramente mejor que el modelo de WA (AUC = 0.86 con valor predictivo negativo [VPN] = 0.98, valor predictivo positivo [VPP] = 0.26, sensibilidad = 0.61, especificidad = 0.92 y precisión = 0.91 en el corte >90º percentil vs. AUC = 0.77 con VPN = 0.98, VPP = 0.15, sensibilidad = 0.43, especificidad = 0.91 y precisión = 0.89 en el corte >90º). Nuestros hallazgos sugieren que los modelos de ML específicos por raza pueden ayudar a identificar a los AAs que pueden tener demencia no diagnosticada. Estudios futuros deberían examinar la generalizabilidad del modelo en entornos con más mujeres y probar si la incorporación de estos modelos en entornos clínicos aumenta la derivación de AAs no diagnosticados a especialistas.
Descripción
La aplicación del procesamiento del lenguaje natural y del aprendizaje automático (ML) en los registros de salud electrónicos (EHRs) puede ayudar a reducir el subdiagnóstico de demencia, pero los modelos que no están diseñados para reflejar a las poblaciones minoritarias pueden en cambio perpetuar el subdiagnóstico. Para mejorar la identificación de la demencia no diagnosticada, especialmente en los afroamericanos (AAs), desarrollamos modelos de ML de máquinas de vectores de soporte (SVM) para asignar puntuaciones de riesgo de demencia basadas en características identificadas en datos no estructurados de EHR (a través de la asignación de Dirichlet latente y la extracción de temas estables en n = 1 M notas) y datos estructurados de EHR. Hipotetizamos que los modelos separados mostrarían diferenciación entre los grupos raciales, por lo que los modelos se ajustaron por separado para los AAs (n = 5 K con códigos de demencia, n = 5 K sin ellos) y para los estadounidenses blancos (WAs; n = 5 K con códigos, n = 5 K sin ellos). Para validar nuestro método, se generaron puntuaciones para muestras separadas de AAs (n = 10 K) y WAs (n = 10 K) sin códigos de demencia, y los EHR de 1.2 K de estos pacientes fueron revisados por expertos en demencia. Todos los sujetos tenían 65 años o más y provenían de la VA, lo que significaba que las muestras eran desproporcionadamente masculinas. Se observó una relación positiva fuerte entre las puntuaciones de riesgo generadas por SVM y la demencia no diagnosticada. Los AAs tenían más probabilidades que los WAs de tener demencia no diagnosticada según la revisión de historiales clínicos, tanto en general (15.3% vs. 9.5%) como entre los veteranos con puntuaciones de corte >90º percentil (25.6% vs. 15.3%). Con las revisiones de historiales clínicos como estándar de referencia y diferentes puntuaciones de corte, el modelo de AA tuvo un rendimiento ligeramente mejor que el modelo de WA (AUC = 0.86 con valor predictivo negativo [VPN] = 0.98, valor predictivo positivo [VPP] = 0.26, sensibilidad = 0.61, especificidad = 0.92 y precisión = 0.91 en el corte >90º percentil vs. AUC = 0.77 con VPN = 0.98, VPP = 0.15, sensibilidad = 0.43, especificidad = 0.91 y precisión = 0.89 en el corte >90º). Nuestros hallazgos sugieren que los modelos de ML específicos por raza pueden ayudar a identificar a los AAs que pueden tener demencia no diagnosticada. Estudios futuros deberían examinar la generalizabilidad del modelo en entornos con más mujeres y probar si la incorporación de estos modelos en entornos clínicos aumenta la derivación de AAs no diagnosticados a especialistas.