Modelo de Aprendizaje por Refuerzo para Optimizar el Precio de la Oferta y la Calidad del Servicio en el Crowdshipping
Autores: Min, Daiki; Lee, Seokgi; Kang, Yuncheol
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Modelo de Aprendizaje por Refuerzo para Optimizar el Precio de la Oferta y la Calidad del Servicio en el Crowdshipping
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Envío colaborativo
Transportistas
Estrategias de puja
Precios de entrega
Condiciones de transporte
Aprendizaje por refuerzo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
El crowdshipping establece una conexión a corto plazo entre los remitentes y los transportistas individuales, cerrando las brechas en los requisitos de servicio en la logística de última milla. Desde la perspectiva de un transportista que opera múltiples vehículos, este estudio considera el desafío de maximizar las ganancias optimizando las estrategias de oferta para los precios de entrega y las condiciones de transporte en el contexto de los servicios de crowdshipping basados en ofertas. Consideramos dos tipos de estrategias de oferta: una oferta de precio que ajusta el cargo de flete de la RFQ y una oferta multiatributo que evalúa tanto el precio como la calidad del servicio. Formulamos el problema como un proceso de decisión de Markov (MDP) para representar procedimientos de toma de decisiones inciertos y secuenciales. Además, dada la complejidad del nuevo problema propuesto, que involucra múltiples vehículos, optimizaciones de rutas y múltiples atributos de las ofertas, empleamos un enfoque de aprendizaje por refuerzo (RL) que aprende una estrategia de oferta óptima. Finalmente, se realizan experimentos numéricos para ilustrar la superioridad de la estrategia de oferta aprendida por RL y analizar el comportamiento de la estrategia de oferta. Un análisis numérico muestra que las estrategias de oferta aprendidas por RL proporcionan más recompensas y menores costos que otras estrategias de referencia. Además, una comparación de estrategias basadas en precios y estrategias multiatributo revela que la elección de estrategias apropiadas depende de la situación.
Descripción
El crowdshipping establece una conexión a corto plazo entre los remitentes y los transportistas individuales, cerrando las brechas en los requisitos de servicio en la logística de última milla. Desde la perspectiva de un transportista que opera múltiples vehículos, este estudio considera el desafío de maximizar las ganancias optimizando las estrategias de oferta para los precios de entrega y las condiciones de transporte en el contexto de los servicios de crowdshipping basados en ofertas. Consideramos dos tipos de estrategias de oferta: una oferta de precio que ajusta el cargo de flete de la RFQ y una oferta multiatributo que evalúa tanto el precio como la calidad del servicio. Formulamos el problema como un proceso de decisión de Markov (MDP) para representar procedimientos de toma de decisiones inciertos y secuenciales. Además, dada la complejidad del nuevo problema propuesto, que involucra múltiples vehículos, optimizaciones de rutas y múltiples atributos de las ofertas, empleamos un enfoque de aprendizaje por refuerzo (RL) que aprende una estrategia de oferta óptima. Finalmente, se realizan experimentos numéricos para ilustrar la superioridad de la estrategia de oferta aprendida por RL y analizar el comportamiento de la estrategia de oferta. Un análisis numérico muestra que las estrategias de oferta aprendidas por RL proporcionan más recompensas y menores costos que otras estrategias de referencia. Además, una comparación de estrategias basadas en precios y estrategias multiatributo revela que la elección de estrategias apropiadas depende de la situación.