Un algoritmo de imputación múltiple consciente del ruido para datos faltantes
Autores: Li, Fangfang; Sun, Hui; Gu, Yu; Yu, Ge
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un algoritmo de imputación múltiple consciente del ruido para datos faltantes
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Datos faltantes
Algoritmo de imputación
Ruidos
Imputación múltiple
Mecanismo de datos faltantes
Robustez
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
Los datos faltantes son un fenómeno común e inevitable. En aplicaciones prácticas, los conjuntos de datos suelen contener ruidos por diversas razones. La mayoría de los algoritmos existentes de imputación de datos faltantes se ven afectados por ruidos que reducen la precisión de la imputación. Este documento propone un algoritmo de imputación múltiple de datos faltantes consciente del ruido, NPMI, en datos estáticos. Se proponen diferentes modelos de imputación múltiple según el mecanismo de datos faltantes. En segundo lugar, se presenta el método para determinar el orden de imputación de variables faltantes. Se propone un algoritmo de consistencia de muestreo aleatorio para estimar los valores iniciales de los parámetros del modelo de imputación múltiple para reducir la influencia de los datos de ruido y mejorar la robustez del algoritmo. Se realizan experimentos en dos conjuntos de datos reales y dos conjuntos de datos sintéticos para verificar la precisión y eficiencia del algoritmo NPMI propuesto, y se analizan los resultados.
Descripción
Los datos faltantes son un fenómeno común e inevitable. En aplicaciones prácticas, los conjuntos de datos suelen contener ruidos por diversas razones. La mayoría de los algoritmos existentes de imputación de datos faltantes se ven afectados por ruidos que reducen la precisión de la imputación. Este documento propone un algoritmo de imputación múltiple de datos faltantes consciente del ruido, NPMI, en datos estáticos. Se proponen diferentes modelos de imputación múltiple según el mecanismo de datos faltantes. En segundo lugar, se presenta el método para determinar el orden de imputación de variables faltantes. Se propone un algoritmo de consistencia de muestreo aleatorio para estimar los valores iniciales de los parámetros del modelo de imputación múltiple para reducir la influencia de los datos de ruido y mejorar la robustez del algoritmo. Se realizan experimentos en dos conjuntos de datos reales y dos conjuntos de datos sintéticos para verificar la precisión y eficiencia del algoritmo NPMI propuesto, y se analizan los resultados.