El aprendizaje federado para proteger los datos de los pacientes: un caso de recuperación de imágenes médicas
Autores: Singh, Gurtaj; Violi, Vincenzo; Fisichella, Marco
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
El aprendizaje federado para proteger los datos de los pacientes: un caso de recuperación de imágenes médicas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Datos de atención médica
Aprendizaje federado
Registros electrónicos de salud
Algoritmo de aprendizaje automático
Análisis de datos respetuoso de la privacidad
Optimización distribuida
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 49
Citaciones: Sin citaciones
Los datos de salud están distribuidos y son confidenciales, lo que dificulta el uso de técnicas de diagnóstico automático centralizadas. Por ejemplo, diferentes hospitales tienen los registros de salud electrónicos (EHR) de diferentes poblaciones de pacientes; sin embargo, transferir estos datos entre hospitales es difícil debido a la naturaleza sensible de la información. Esto presenta un obstáculo significativo para el desarrollo de métodos analíticos eficientes y generalizables que requieren una gran cantidad de Big Data diverso. El aprendizaje federado permite que múltiples instituciones trabajen juntas para desarrollar un algoritmo de aprendizaje automático sin compartir sus datos. Realizamos un estudio sistemático para analizar el estado actual del aprendizaje federado en la industria de la salud y explorar tanto las limitaciones de esta tecnología como su potencial. Las organizaciones comparten los parámetros de sus modelos entre sí. Esto les permite obtener los beneficios de un modelo desarrollado con un conjunto de datos más rico mientras protegen la confidencialidad de sus datos. Los métodos estándar para el aprendizaje automático a gran escala, la optimización distribuida y la analítica de datos respetuosos con la privacidad deben ser replanteados fundamentalmente para abordar los nuevos problemas planteados por el entrenamiento en redes diversas que pueden contener grandes cantidades de datos. En este artículo, discutimos las cualidades y dificultades particulares del aprendizaje federado, proporcionamos una visión general completa de los enfoques actuales y delineamos varias direcciones para futuros trabajos que son relevantes para una variedad de comunidades de investigación. Estos problemas son importantes para muchas comunidades de investigación diferentes.
Descripción
Los datos de salud están distribuidos y son confidenciales, lo que dificulta el uso de técnicas de diagnóstico automático centralizadas. Por ejemplo, diferentes hospitales tienen los registros de salud electrónicos (EHR) de diferentes poblaciones de pacientes; sin embargo, transferir estos datos entre hospitales es difícil debido a la naturaleza sensible de la información. Esto presenta un obstáculo significativo para el desarrollo de métodos analíticos eficientes y generalizables que requieren una gran cantidad de Big Data diverso. El aprendizaje federado permite que múltiples instituciones trabajen juntas para desarrollar un algoritmo de aprendizaje automático sin compartir sus datos. Realizamos un estudio sistemático para analizar el estado actual del aprendizaje federado en la industria de la salud y explorar tanto las limitaciones de esta tecnología como su potencial. Las organizaciones comparten los parámetros de sus modelos entre sí. Esto les permite obtener los beneficios de un modelo desarrollado con un conjunto de datos más rico mientras protegen la confidencialidad de sus datos. Los métodos estándar para el aprendizaje automático a gran escala, la optimización distribuida y la analítica de datos respetuosos con la privacidad deben ser replanteados fundamentalmente para abordar los nuevos problemas planteados por el entrenamiento en redes diversas que pueden contener grandes cantidades de datos. En este artículo, discutimos las cualidades y dificultades particulares del aprendizaje federado, proporcionamos una visión general completa de los enfoques actuales y delineamos varias direcciones para futuros trabajos que son relevantes para una variedad de comunidades de investigación. Estos problemas son importantes para muchas comunidades de investigación diferentes.