Sobre la Generalizabilidad de los Algoritmos de Clasificación de Aprendizaje Automático y Su Aplicación al Estudio del Corazón de Framingham
Autores: Kahouadji, Nabil
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Sobre la Generalizabilidad de los Algoritmos de Clasificación de Aprendizaje Automático y Su Aplicación al Estudio del Corazón de Framingham
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Algoritmos de aprendizaje automático
Atención médica
Sesgos
Generalizabilidad
Algoritmos de clasificación
Enfermedad coronaria de Framingham
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El uso de algoritmos de aprendizaje automático en la atención médica puede amplificar las injusticias sociales y las inequidades en salud. Si bien la exacerbación de sesgos puede ocurrir y ser agravada durante la selección de problemas, la recolección de datos y la definición de resultados, esta investigación se refiere a los impedimentos de generalización que ocurren durante el desarrollo y la implementación posterior de algoritmos de clasificación de aprendizaje automático. Usando los datos de enfermedad coronaria de Framingham como estudio de caso, mostramos cómo seleccionar efectivamente un punto de corte de probabilidad para convertir un modelo de regresión para una variable dicotómica en un clasificador. Luego comparamos la distribución de muestreo del rendimiento predictivo de ocho algoritmos de clasificación de aprendizaje automático bajo cuatro escenarios de entrenamiento/prueba estratificados para evaluar su generalización y su potencial para perpetuar sesgos. Mostramos que tanto el aumento extremo de gradiente como la máquina de soporte vectorial son defectuosos cuando se entrenan con un conjunto de datos desbalanceado. Luego mostramos que la puntuación discriminante doble de tipo 1 y 2 es la más generalizable con respecto a las tasas de verdaderos positivos y negativos, respectivamente, ya que supera consistentemente a los otros algoritmos de clasificación, independientemente del escenario de entrenamiento/prueba. Finalmente, introducimos una metodología para extraer una jerarquía de variables óptima para un algoritmo de clasificación y la ilustramos en los datos de enfermedad coronaria de Framingham en general, así como en los de hombres y mujeres.
Descripción
El uso de algoritmos de aprendizaje automático en la atención médica puede amplificar las injusticias sociales y las inequidades en salud. Si bien la exacerbación de sesgos puede ocurrir y ser agravada durante la selección de problemas, la recolección de datos y la definición de resultados, esta investigación se refiere a los impedimentos de generalización que ocurren durante el desarrollo y la implementación posterior de algoritmos de clasificación de aprendizaje automático. Usando los datos de enfermedad coronaria de Framingham como estudio de caso, mostramos cómo seleccionar efectivamente un punto de corte de probabilidad para convertir un modelo de regresión para una variable dicotómica en un clasificador. Luego comparamos la distribución de muestreo del rendimiento predictivo de ocho algoritmos de clasificación de aprendizaje automático bajo cuatro escenarios de entrenamiento/prueba estratificados para evaluar su generalización y su potencial para perpetuar sesgos. Mostramos que tanto el aumento extremo de gradiente como la máquina de soporte vectorial son defectuosos cuando se entrenan con un conjunto de datos desbalanceado. Luego mostramos que la puntuación discriminante doble de tipo 1 y 2 es la más generalizable con respecto a las tasas de verdaderos positivos y negativos, respectivamente, ya que supera consistentemente a los otros algoritmos de clasificación, independientemente del escenario de entrenamiento/prueba. Finalmente, introducimos una metodología para extraer una jerarquía de variables óptima para un algoritmo de clasificación y la ilustramos en los datos de enfermedad coronaria de Framingham en general, así como en los de hombres y mujeres.