logo móvil
Contáctanos

Sobre la Generalizabilidad de los Algoritmos de Clasificación de Aprendizaje Automático y Su Aplicación al Estudio del Corazón de Framingham

Autores: Kahouadji, Nabil

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Sobre la Generalizabilidad de los Algoritmos de Clasificación de Aprendizaje Automático y Su Aplicación al Estudio del Corazón de Framingham


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Algoritmos de aprendizaje automático
Atención médica
Sesgos
Generalizabilidad
Algoritmos de clasificación
Enfermedad coronaria de Framingham

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
El uso de algoritmos de aprendizaje automático en la atención médica puede amplificar las injusticias sociales y las inequidades en salud. Si bien la exacerbación de sesgos puede ocurrir y ser agravada durante la selección de problemas, la recolección de datos y la definición de resultados, esta investigación se refiere a los impedimentos de generalización que ocurren durante el desarrollo y la implementación posterior de algoritmos de clasificación de aprendizaje automático. Usando los datos de enfermedad coronaria de Framingham como estudio de caso, mostramos cómo seleccionar efectivamente un punto de corte de probabilidad para convertir un modelo de regresión para una variable dicotómica en un clasificador. Luego comparamos la distribución de muestreo del rendimiento predictivo de ocho algoritmos de clasificación de aprendizaje automático bajo cuatro escenarios de entrenamiento/prueba estratificados para evaluar su generalización y su potencial para perpetuar sesgos. Mostramos que tanto el aumento extremo de gradiente como la máquina de soporte vectorial son defectuosos cuando se entrenan con un conjunto de datos desbalanceado. Luego mostramos que la puntuación discriminante doble de tipo 1 y 2 es la más generalizable con respecto a las tasas de verdaderos positivos y negativos, respectivamente, ya que supera consistentemente a los otros algoritmos de clasificación, independientemente del escenario de entrenamiento/prueba. Finalmente, introducimos una metodología para extraer una jerarquía de variables óptima para un algoritmo de clasificación y la ilustramos en los datos de enfermedad coronaria de Framingham en general, así como en los de hombres y mujeres.

Otros recursos que podrían interesarte

Temas Virtualpro