La predicción de la demanda de productos basada en la localidad habilitada por la computación de niebla y la toma de decisiones utilizando el aprendizaje por refuerzo
Autores: Neelakantam, Gone; Onthoni, Djeane Debora; Sahoo, Prasan Kumar
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
La predicción de la demanda de productos basada en la localidad habilitada por la computación de niebla y la toma de decisiones utilizando el aprendizaje por refuerzo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Desperdicio
Productos
Supermercado
Análisis de datos
Toma de decisiones
Predicción de la demanda
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 47
Citaciones: Sin citaciones
El desperdicio de productos perecederos y no perecederos debido al monitoreo manual en centros comerciales genera grandes pérdidas de ingresos en la industria de supermercados. Además, factores internos y externos como eventos del calendario y condiciones climáticas contribuyen al exceso de desperdicio de productos en diferentes regiones de supermercados. Es un trabajo desafiante conocer sobre el desperdicio de los productos manualmente en diferentes regiones de supermercados. Por lo tanto, la administración de supermercados necesita tomar decisiones y acciones apropiadas para prevenir el desperdicio de productos. Los centros de datos de computación de niebla ubicados en cada región pueden recolectar, procesar y analizar datos para la predicción de la demanda y la toma de decisiones. En este documento, se diseña un modelo de predicción de la demanda de productos utilizando el Análisis de Componentes Principales (PCA) integrado y los algoritmos de Aprendizaje No Supervisado K-medias, y se desarrolla un modelo de toma de decisiones utilizando el algoritmo de Aprendizaje por Refuerzo SARSA (Estado-Acción-Recompensa-Estado-Acción). Nuestro método propuesto puede agrupar los productos en productos de baja, media y alta demanda mediante el aprendizaje de las características diseñadas. Tomando el modelo de agrupación derivado, la toma de decisiones para distribuir productos de baja a alta demanda se puede realizar utilizando SARSA. Los resultados experimentales muestran que nuestro método propuesto puede agrupar bien los conjuntos de datos con una puntuación de Silueta de . Además, nuestro modelo de toma de decisiones basado en SARSA supera a los algoritmos de Q-Learning, Monte-Carlo, Deep Q-Network (DQN) y Actor-Critic en términos de recompensa acumulada máxima, recompensa acumulada promedio y tiempo de ejecución.
Descripción
El desperdicio de productos perecederos y no perecederos debido al monitoreo manual en centros comerciales genera grandes pérdidas de ingresos en la industria de supermercados. Además, factores internos y externos como eventos del calendario y condiciones climáticas contribuyen al exceso de desperdicio de productos en diferentes regiones de supermercados. Es un trabajo desafiante conocer sobre el desperdicio de los productos manualmente en diferentes regiones de supermercados. Por lo tanto, la administración de supermercados necesita tomar decisiones y acciones apropiadas para prevenir el desperdicio de productos. Los centros de datos de computación de niebla ubicados en cada región pueden recolectar, procesar y analizar datos para la predicción de la demanda y la toma de decisiones. En este documento, se diseña un modelo de predicción de la demanda de productos utilizando el Análisis de Componentes Principales (PCA) integrado y los algoritmos de Aprendizaje No Supervisado K-medias, y se desarrolla un modelo de toma de decisiones utilizando el algoritmo de Aprendizaje por Refuerzo SARSA (Estado-Acción-Recompensa-Estado-Acción). Nuestro método propuesto puede agrupar los productos en productos de baja, media y alta demanda mediante el aprendizaje de las características diseñadas. Tomando el modelo de agrupación derivado, la toma de decisiones para distribuir productos de baja a alta demanda se puede realizar utilizando SARSA. Los resultados experimentales muestran que nuestro método propuesto puede agrupar bien los conjuntos de datos con una puntuación de Silueta de . Además, nuestro modelo de toma de decisiones basado en SARSA supera a los algoritmos de Q-Learning, Monte-Carlo, Deep Q-Network (DQN) y Actor-Critic en términos de recompensa acumulada máxima, recompensa acumulada promedio y tiempo de ejecución.