logo móvil
Contáctanos

FedISM: Mejorando el desequilibrio de datos a través de un modelo compartido en el aprendizaje federado

Autores: Chung, Wu-Chun; Lin, Yan-Hui; Fang, Sih-Han

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

FedISM: Mejorando el desequilibrio de datos a través de un modelo compartido en el aprendizaje federado


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Privacidad
Aprendizaje federado
Desequilibrio de datos
Degradación del rendimiento
Método FedISM
Mecanismo de Selección de Candidatos

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 21

Citaciones: Sin citaciones


Descripción
Considerando la sensibilidad de los datos en escenarios médicos, el aprendizaje federado (FL) es adecuado para aplicaciones que requieren privacidad de datos. El personal médico puede utilizar el marco de FL para el aprendizaje automático para ayudar en el análisis de datos a gran escala que están protegidos dentro de la institución. Sin embargo, no todos los clientes tienen la misma distribución de conjuntos de datos, por lo que se producen problemas de desequilibrio de datos entre los clientes. El principal desafío es superar la degradación del rendimiento causada por la baja precisión y la incapacidad para converger el modelo. Este documento propone un método FedISM para mejorar el rendimiento en el caso de Distribución No Independiente e Idénticamente Distribuida (Non-IID). FedISM explota un modelo compartido entrenado en un conjunto de datos candidato antes de realizar FL entre clientes. Se propuso un Mecanismo de Selección de Candidatos (CSM) para seleccionar de manera efectiva al candidato más adecuado entre los clientes para entrenar el modelo compartido. Basado en los enfoques propuestos, FedISM no solo entrena el modelo compartido sin compartir datos crudos, sino que también proporciona una solución óptima a través de la selección del mejor modelo compartido. Para evaluar el rendimiento, se aplicó el FedISM propuesto para clasificar la enfermedad del coronavirus (COVID), neumonía, normal y neumonía viral en los experimentos. El proceso de Dirichlet también se utilizó para simular una variedad de distribuciones de datos desequilibradas. Los resultados experimentales muestran que FedISM mejora la precisión hasta en un 25% cuando las preocupaciones de privacidad sobre los datos de los pacientes están aumentando entre las instituciones médicas.

Otros recursos que podrían interesarte

Temas Virtualpro