Modelo de Aprendizaje por Refuerzo para Optimizar el Precio de la Oferta y la Calidad del Servicio en el Crowdshipping

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Modelo de Aprendizaje por Refuerzo para Optimizar el Precio de la Oferta y la Calidad del Servicio en el Crowdshipping

Autores: Min, Daiki; Lee, Seokgi; Kang, Yuncheol

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico

2025

Modelo de Aprendizaje por Refuerzo para Optimizar el Precio de la Oferta y la Calidad del Servicio en el Crowdshipping

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Sistemas

Palabras clave

Envío colaborativo

Transportistas

Estrategias de puja

Precios de entrega

Condiciones de transporte

Aprendizaje por refuerzo

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 30

Citaciones: Sin citaciones

El crowdshipping establece una conexión a corto plazo entre los remitentes y los transportistas individuales, cerrando las brechas en los requisitos de servicio en la logística de última milla. Desde la perspectiva de un transportista que opera múltiples vehículos, este estudio considera el desafío de maximizar las ganancias optimizando las estrategias de oferta para los precios de entrega y las condiciones de transporte en el contexto de los servicios de crowdshipping basados en ofertas. Consideramos dos tipos de estrategias de oferta: una oferta de precio que ajusta el cargo de flete de la RFQ y una oferta multiatributo que evalúa tanto el precio como la calidad del servicio. Formulamos el problema como un proceso de decisión de Markov (MDP) para representar procedimientos de toma de decisiones inciertos y secuenciales. Además, dada la complejidad del nuevo problema propuesto, que involucra múltiples vehículos, optimizaciones de rutas y múltiples atributos de las ofertas, empleamos un enfoque de aprendizaje por refuerzo (RL) que aprende una estrategia de oferta óptima. Finalmente, se realizan experimentos numéricos para ilustrar la superioridad de la estrategia de oferta aprendida por RL y analizar el comportamiento de la estrategia de oferta. Un análisis numérico muestra que las estrategias de oferta aprendidas por RL proporcionan más recompensas y menores costos que otras estrategias de referencia. Además, una comparación de estrategias basadas en precios y estrategias multiatributo revela que la elección de estrategias apropiadas depende de la situación.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro