Variational inference sobre flujos de datos no estacionarios para modelos de familia exponencial
Autores: Masegosa, Andrés R.; Ramos-López, Darío; Salmerón, Antonio; Langseth, Helge; Nielsen, Thomas D.
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Variational inference sobre flujos de datos no estacionarios para modelos de familia exponencial
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Problemas modernos de análisis de datos
Inferencia bayesiana
Flujo de datos
Métodos variacionales
Modelos de familia exponencial
Cambio de concepto
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
En muchos problemas modernos de análisis de datos, los datos disponibles no son estáticos, sino que llegan de forma continua. Realizar inferencia bayesiana en un flujo de datos es desafiante por varias razones. Primero, requiere actualización continua del modelo y la capacidad de manejar una distribución posterior condicionada a un conjunto de datos ilimitado. En segundo lugar, la distribución subyacente de los datos puede cambiar de un paso de tiempo a otro, y la suposición clásica de i.i.d. (independiente e idénticamente distribuida) o de intercambiabilidad de datos ya no se cumple. En este documento, presentamos un enfoque aproximado de inferencia bayesiana utilizando métodos variacionales que aborda estos problemas para modelos conjugados de familias exponenciales con variables latentes. Nuestra propuesta utiliza un esquema novedoso basado en priors jerárquicos para modelar explícitamente los cambios temporales de los parámetros del modelo. Mostramos cómo este enfoque induce un mecanismo de olvido exponencial con tasas de olvido adaptativas. El método es capaz de capturar la suavidad del cambio de concepto, que va desde ningún cambio hasta un cambio abrupto. El esquema de inferencia variacional propuesto mantiene la eficiencia computacional de los métodos variacionales sobre modelos conjugados, lo cual es crítico en entornos de flujo de datos. El enfoque se valida en cuatro dominios diferentes (energía, finanzas, geolocalización y texto) utilizando cuatro conjuntos de datos del mundo real.
Descripción
En muchos problemas modernos de análisis de datos, los datos disponibles no son estáticos, sino que llegan de forma continua. Realizar inferencia bayesiana en un flujo de datos es desafiante por varias razones. Primero, requiere actualización continua del modelo y la capacidad de manejar una distribución posterior condicionada a un conjunto de datos ilimitado. En segundo lugar, la distribución subyacente de los datos puede cambiar de un paso de tiempo a otro, y la suposición clásica de i.i.d. (independiente e idénticamente distribuida) o de intercambiabilidad de datos ya no se cumple. En este documento, presentamos un enfoque aproximado de inferencia bayesiana utilizando métodos variacionales que aborda estos problemas para modelos conjugados de familias exponenciales con variables latentes. Nuestra propuesta utiliza un esquema novedoso basado en priors jerárquicos para modelar explícitamente los cambios temporales de los parámetros del modelo. Mostramos cómo este enfoque induce un mecanismo de olvido exponencial con tasas de olvido adaptativas. El método es capaz de capturar la suavidad del cambio de concepto, que va desde ningún cambio hasta un cambio abrupto. El esquema de inferencia variacional propuesto mantiene la eficiencia computacional de los métodos variacionales sobre modelos conjugados, lo cual es crítico en entornos de flujo de datos. El enfoque se valida en cuatro dominios diferentes (energía, finanzas, geolocalización y texto) utilizando cuatro conjuntos de datos del mundo real.