Personalized dynamic pricing basado en improved thompson sampling
Autores: Bi, Wenjie; Wang, Bing; Liu, Haiying
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Personalized dynamic pricing basado en improved thompson sampling
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Estudio
Precios personalizados
Aprendizaje de la demanda
Algoritmo de Thompson Sampling
Modelo logit
Vectores de alta dimensionalidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
Este estudio investiga la fijación de precios personalizada con aprendizaje de la demanda. Primero codificamos la información de características personalizadas del consumidor en vectores de alta dimensión, luego establecemos la relación entre este vector de características y la demanda del producto utilizando un modelo logit, y finalmente aprendemos los parámetros de la demanda a través de datos históricos de transacciones. Para abordar el equilibrio entre el aprendizaje y los ingresos, introducimos el algoritmo de Thompson Sampling. Considerando la dificultad de la inferencia bayesiana en Thompson Sampling debido a vectores de características de alta dimensión, mejoramos el Thompson Sampling básico aproximando la función de verosimilitud del modelo logit con la distribución Pólya-Gamma (PG) y proponiendo un algoritmo de Thompson Sampling basado en la distribución PG. Para validar la efectividad del algoritmo propuesto, realizamos experimentos utilizando tanto datos simulados como datos reales de préstamos proporcionados por el Centro de Gestión de Ingresos de la Universidad de Columbia. Los resultados del estudio demuestran que el algoritmo de Thompson Sampling basado en la distribución PG propuesto supera a los métodos tradicionales de aproximación de Laplace en cuanto a velocidad de convergencia y valor de arrepentimiento en experimentos con datos reales y simulados. El algoritmo de fijación de precios personalizada en tiempo real desarrollado aquí no solo enriquece la investigación teórica de la fijación de precios dinámica personalizada, sino que también proporciona una base teórica y orientación para que las empresas implementen la fijación de precios personalizada.
Descripción
Este estudio investiga la fijación de precios personalizada con aprendizaje de la demanda. Primero codificamos la información de características personalizadas del consumidor en vectores de alta dimensión, luego establecemos la relación entre este vector de características y la demanda del producto utilizando un modelo logit, y finalmente aprendemos los parámetros de la demanda a través de datos históricos de transacciones. Para abordar el equilibrio entre el aprendizaje y los ingresos, introducimos el algoritmo de Thompson Sampling. Considerando la dificultad de la inferencia bayesiana en Thompson Sampling debido a vectores de características de alta dimensión, mejoramos el Thompson Sampling básico aproximando la función de verosimilitud del modelo logit con la distribución Pólya-Gamma (PG) y proponiendo un algoritmo de Thompson Sampling basado en la distribución PG. Para validar la efectividad del algoritmo propuesto, realizamos experimentos utilizando tanto datos simulados como datos reales de préstamos proporcionados por el Centro de Gestión de Ingresos de la Universidad de Columbia. Los resultados del estudio demuestran que el algoritmo de Thompson Sampling basado en la distribución PG propuesto supera a los métodos tradicionales de aproximación de Laplace en cuanto a velocidad de convergencia y valor de arrepentimiento en experimentos con datos reales y simulados. El algoritmo de fijación de precios personalizada en tiempo real desarrollado aquí no solo enriquece la investigación teórica de la fijación de precios dinámica personalizada, sino que también proporciona una base teórica y orientación para que las empresas implementen la fijación de precios personalizada.