Variational autoencoding con muestreo iterativo condicional para la imputación de datos faltantes
Autores: Kuang, Shenfen; Song, Jie; Wang, Shangjiu; Zhu, Huafeng
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Variational autoencoding con muestreo iterativo condicional para la imputación de datos faltantes
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Variational autoencoders
Capacidades de representación no lineales
Imputación de datos faltantes
Autoencoder variacional beta ponderado por importancia
Método de imputación de muestreo iterativo condicional
Estrategia de re-muestreo ponderado por importancia
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 18
Citaciones: Sin citaciones
Los autoencoders variacionales (VAEs) son populares por sus sólidas capacidades de representación no lineal y han logrado avances notables en el problema de imputación de datos faltantes. Sin embargo, los métodos de imputación existentes a menudo muestran inestabilidad debido a la aleatoriedad inherente en el proceso de muestreo, lo que lleva a una subestimación o sobreajuste, especialmente al manejar tipos de datos faltantes complejos como imágenes. Para abordar este desafío, presentamos un método de imputación de muestreo iterativo condicional. Inicialmente, empleamos un autoencoder variacional beta ponderado por importancia para aprender la distribución condicional a partir de los datos observados. Posteriormente, aprovechando la estrategia de remuestreo ponderado por importancia, se extraen muestras de manera iterativa de la distribución condicional para calcular la expectativa condicional de los datos faltantes. El método propuesto ha sido evaluado experimentalmente utilizando conjuntos de datos generativos clásicos y se ha comparado con varios métodos de imputación bien conocidos para validar su efectividad.
Descripción
Los autoencoders variacionales (VAEs) son populares por sus sólidas capacidades de representación no lineal y han logrado avances notables en el problema de imputación de datos faltantes. Sin embargo, los métodos de imputación existentes a menudo muestran inestabilidad debido a la aleatoriedad inherente en el proceso de muestreo, lo que lleva a una subestimación o sobreajuste, especialmente al manejar tipos de datos faltantes complejos como imágenes. Para abordar este desafío, presentamos un método de imputación de muestreo iterativo condicional. Inicialmente, empleamos un autoencoder variacional beta ponderado por importancia para aprender la distribución condicional a partir de los datos observados. Posteriormente, aprovechando la estrategia de remuestreo ponderado por importancia, se extraen muestras de manera iterativa de la distribución condicional para calcular la expectativa condicional de los datos faltantes. El método propuesto ha sido evaluado experimentalmente utilizando conjuntos de datos generativos clásicos y se ha comparado con varios métodos de imputación bien conocidos para validar su efectividad.