Aprendizaje por Refuerzo Multi-Agente para la Entrega de Comida en Línea con Preservación de la Privacidad de la Ubicación
Autores: Abahussein, Suleiman; Ye, Dayong; Zhu, Congcong; Cheng, Zishuo; Siddique, Umer; Shen, Sheng
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Aprendizaje por Refuerzo Multi-Agente para la Entrega de Comida en Línea con Preservación de la Privacidad de la Ubicación
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Servicios de entrega de comida en línea
Mensajeros
Aprendizaje por refuerzo multiagente
Demanda
Método de protección de la ubicación del usuario
Privacidad diferencial
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los servicios de entrega de comida en línea hoy en día se consideran un servicio esencial que recibe una atención significativa en todo el mundo. Muchas empresas e individuos están involucrados en este campo, ya que ofrece buenos ingresos y numerosos empleos a la comunidad. En esta investigación, consideramos el problema de los servicios de entrega de comida en línea y cómo podemos aumentar el número de pedidos recibidos por los mensajeros y, por lo tanto, aumentar sus ingresos. Se emplea el aprendizaje por refuerzo multiagente (MARL) para guiar a los mensajeros hacia áreas con alta demanda de solicitudes de entrega de comida. Un mapa de la ciudad se divide en pequeñas cuadrículas, y cada cuadrícula representa un área pequeña de la ciudad que tiene una demanda diferente de pedidos de entrega de comida en línea. El agente MARL entrena y aprende qué cuadrícula tiene la mayor demanda y luego la selecciona. Así, los mensajeros pueden recibir más pedidos de entrega de comida y, por lo tanto, aumentar sus ingresos a largo plazo. Si bien aumentar el número de pedidos recibidos es importante, proteger la ubicación del cliente también es esencial. Por lo tanto, se propone en esta investigación el Método de Protección de Ubicación del Usuario (PULM) para proteger la información de ubicación del cliente. El PULM inyecta ruido Laplace de privacidad diferencial (DP) basado en dos parámetros: el tamaño del área de la ciudad y la frecuencia de pedidos de entrega de comida en línea del cliente. Utilizamos dos conjuntos de datos: Shenzhen, China, e Iowa, EE. UU., para demostrar los resultados de nuestros experimentos. Los resultados muestran un aumento en el número de pedidos recibidos en los conjuntos de datos de Shenzhen y Iowa City. También mostramos la similitud y la utilidad de los datos de las trayectorias de los mensajeros después de utilizar nuestro método de ofuscación (PULM).
Descripción
Los servicios de entrega de comida en línea hoy en día se consideran un servicio esencial que recibe una atención significativa en todo el mundo. Muchas empresas e individuos están involucrados en este campo, ya que ofrece buenos ingresos y numerosos empleos a la comunidad. En esta investigación, consideramos el problema de los servicios de entrega de comida en línea y cómo podemos aumentar el número de pedidos recibidos por los mensajeros y, por lo tanto, aumentar sus ingresos. Se emplea el aprendizaje por refuerzo multiagente (MARL) para guiar a los mensajeros hacia áreas con alta demanda de solicitudes de entrega de comida. Un mapa de la ciudad se divide en pequeñas cuadrículas, y cada cuadrícula representa un área pequeña de la ciudad que tiene una demanda diferente de pedidos de entrega de comida en línea. El agente MARL entrena y aprende qué cuadrícula tiene la mayor demanda y luego la selecciona. Así, los mensajeros pueden recibir más pedidos de entrega de comida y, por lo tanto, aumentar sus ingresos a largo plazo. Si bien aumentar el número de pedidos recibidos es importante, proteger la ubicación del cliente también es esencial. Por lo tanto, se propone en esta investigación el Método de Protección de Ubicación del Usuario (PULM) para proteger la información de ubicación del cliente. El PULM inyecta ruido Laplace de privacidad diferencial (DP) basado en dos parámetros: el tamaño del área de la ciudad y la frecuencia de pedidos de entrega de comida en línea del cliente. Utilizamos dos conjuntos de datos: Shenzhen, China, e Iowa, EE. UU., para demostrar los resultados de nuestros experimentos. Los resultados muestran un aumento en el número de pedidos recibidos en los conjuntos de datos de Shenzhen y Iowa City. También mostramos la similitud y la utilidad de los datos de las trayectorias de los mensajeros después de utilizar nuestro método de ofuscación (PULM).