logo móvil
Contáctanos

Aprendizaje por Refuerzo Multi-Agente para la Entrega de Comida en Línea con Preservación de la Privacidad de la Ubicación

Autores: Abahussein, Suleiman; Ye, Dayong; Zhu, Congcong; Cheng, Zishuo; Siddique, Umer; Shen, Sheng

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Aprendizaje por Refuerzo Multi-Agente para la Entrega de Comida en Línea con Preservación de la Privacidad de la Ubicación


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Servicios de entrega de comida en línea
Mensajeros
Aprendizaje por refuerzo multiagente
Demanda
Método de protección de la ubicación del usuario
Privacidad diferencial

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Los servicios de entrega de comida en línea hoy en día se consideran un servicio esencial que recibe una atención significativa en todo el mundo. Muchas empresas e individuos están involucrados en este campo, ya que ofrece buenos ingresos y numerosos empleos a la comunidad. En esta investigación, consideramos el problema de los servicios de entrega de comida en línea y cómo podemos aumentar el número de pedidos recibidos por los mensajeros y, por lo tanto, aumentar sus ingresos. Se emplea el aprendizaje por refuerzo multiagente (MARL) para guiar a los mensajeros hacia áreas con alta demanda de solicitudes de entrega de comida. Un mapa de la ciudad se divide en pequeñas cuadrículas, y cada cuadrícula representa un área pequeña de la ciudad que tiene una demanda diferente de pedidos de entrega de comida en línea. El agente MARL entrena y aprende qué cuadrícula tiene la mayor demanda y luego la selecciona. Así, los mensajeros pueden recibir más pedidos de entrega de comida y, por lo tanto, aumentar sus ingresos a largo plazo. Si bien aumentar el número de pedidos recibidos es importante, proteger la ubicación del cliente también es esencial. Por lo tanto, se propone en esta investigación el Método de Protección de Ubicación del Usuario (PULM) para proteger la información de ubicación del cliente. El PULM inyecta ruido Laplace de privacidad diferencial (DP) basado en dos parámetros: el tamaño del área de la ciudad y la frecuencia de pedidos de entrega de comida en línea del cliente. Utilizamos dos conjuntos de datos: Shenzhen, China, e Iowa, EE. UU., para demostrar los resultados de nuestros experimentos. Los resultados muestran un aumento en el número de pedidos recibidos en los conjuntos de datos de Shenzhen y Iowa City. También mostramos la similitud y la utilidad de los datos de las trayectorias de los mensajeros después de utilizar nuestro método de ofuscación (PULM).

Otros recursos que podrían interesarte

Temas Virtualpro