Multi-party privacidad-preservando regresión logística con filtrado de datos de baja calidad para contribuyentes de IoT
Autores: Edemacu, Kennedy; Kim, Jong Wook
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Multi-party privacidad-preservando regresión logística con filtrado de datos de baja calidad para contribuyentes de IoT
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Internet de las cosas
Regresión logística
Calidad de datos
Preocupaciones de privacidad
Colaboración entre múltiples partes
Cifrado homomórfico
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
Hoy en día, el internet de las cosas (IoT) se utiliza para generar datos en varios dominios de aplicación. Una regresión logística, que es un algoritmo estándar de aprendizaje automático con un amplio rango de aplicación, se construye sobre estos datos. Sin embargo, construir un modelo de regresión logística potente y efectivo requiere grandes cantidades de datos. Por lo tanto, la colaboración entre múltiples participantes de IoT ha sido a menudo el enfoque preferido. Sin embargo, las preocupaciones de privacidad y la mala calidad de los datos son dos desafíos que amenazan el éxito de dicho entorno. Varios estudios han propuesto diferentes métodos para abordar la preocupación por la privacidad, pero hasta donde sabemos, se ha prestado poca atención a abordar los problemas de mala calidad de datos en el modelo de regresión logística multipartidista. Por lo tanto, en este estudio, proponemos un marco de regresión logística multipartidista preservando la privacidad con filtrado de datos de baja calidad para los contribuyentes de datos de IoT para abordar ambos problemas. Específicamente, proponemos una nueva métrica en un entorno distribuido que empleamos para filtrar los parámetros de los contribuyentes de datos con datos de baja calidad. Para resolver el desafío de privacidad, empleamos el cifrado homomórfico. El análisis teórico y las evaluaciones experimentales utilizando conjuntos de datos del mundo real demuestran que nuestro marco propuesto es preservador de la privacidad y robusto contra datos de baja calidad.
Descripción
Hoy en día, el internet de las cosas (IoT) se utiliza para generar datos en varios dominios de aplicación. Una regresión logística, que es un algoritmo estándar de aprendizaje automático con un amplio rango de aplicación, se construye sobre estos datos. Sin embargo, construir un modelo de regresión logística potente y efectivo requiere grandes cantidades de datos. Por lo tanto, la colaboración entre múltiples participantes de IoT ha sido a menudo el enfoque preferido. Sin embargo, las preocupaciones de privacidad y la mala calidad de los datos son dos desafíos que amenazan el éxito de dicho entorno. Varios estudios han propuesto diferentes métodos para abordar la preocupación por la privacidad, pero hasta donde sabemos, se ha prestado poca atención a abordar los problemas de mala calidad de datos en el modelo de regresión logística multipartidista. Por lo tanto, en este estudio, proponemos un marco de regresión logística multipartidista preservando la privacidad con filtrado de datos de baja calidad para los contribuyentes de datos de IoT para abordar ambos problemas. Específicamente, proponemos una nueva métrica en un entorno distribuido que empleamos para filtrar los parámetros de los contribuyentes de datos con datos de baja calidad. Para resolver el desafío de privacidad, empleamos el cifrado homomórfico. El análisis teórico y las evaluaciones experimentales utilizando conjuntos de datos del mundo real demuestran que nuestro marco propuesto es preservador de la privacidad y robusto contra datos de baja calidad.