logo móvil
Contáctanos

Predicción de series temporales de tráfico web utilizando redes neuronales LSTM con entrenamiento distribuido asíncrono

Autores: Casado-Vara, Roberto; Martin del Rey, Angel; Pérez-Palau, Daniel; de-la-Fuente-Valentín, Luis; Corchado, Juan M.

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico
2021

Predicción de series temporales de tráfico web utilizando redes neuronales LSTM con entrenamiento distribuido asíncrono


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Tráfico web
Pronóstico
Conjunto de datos
Modelo de IA
Predicciones
Series temporales

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 21

Citaciones: Sin citaciones


Descripción
Evaluar el tráfico web en un servidor web es sumamente crítico para los proveedores de servicios web, ya que, sin una previsión de la demanda adecuada, los clientes podrían experimentar largos tiempos de espera y abandonar ese sitio web. Sin embargo, esta es una tarea desafiante ya que requiere hacer predicciones confiables basadas en la naturaleza arbitraria del comportamiento humano. Presentamos una arquitectura que recopila datos fuente y de manera supervisada realiza el pronóstico de la serie temporal de las visualizaciones de páginas. Basados en el conjunto de datos de visualizaciones de páginas de Wikipedia propuesto en una competencia por Kaggle en 2017, creamos una versión actualizada para los años 2018-2020. Este conjunto de datos es procesado y se obtienen las características y patrones ocultos en los datos para posteriormente diseñar una versión avanzada de una red neuronal recurrente llamada Memoria a Corto Plazo de Largo Plazo. Este modelo de IA es de entrenamiento distribuido, de acuerdo con el paradigma llamado paralelismo de datos y utilizando la estrategia de entrenamiento Downpour. Las predicciones realizadas para los siete idiomas dominantes en el conjunto de datos son precisas con una función de pérdida y error de medición en rangos razonables. A pesar de que las series temporales analizadas tienen patrones bastante malos de estacionalidad y tendencia, las predicciones han sido bastante buenas, evidenciando que un análisis de los patrones ocultos y la extracción de características antes del diseño del modelo de IA mejora la precisión del modelo. Además, la mejora de la precisión del modelo con el entrenamiento distribuido es notable. Dado que la tarea de predecir el tráfico web en cantidades lo más precisas posible requiere conjuntos de datos grandes, diseñamos un sistema de pronóstico para ser preciso a pesar de tener datos limitados en el conjunto de datos. Probamos el modelo propuesto en el nuevo conjunto de datos de visualizaciones de páginas de Wikipedia que creamos y obtuvimos una predicción altamente precisa; de hecho, el error absoluto medio de las predicciones con respecto al original en promedio está por debajo de 30. Esto representa un avance significativo en el campo de la predicción de series temporales para el pronóstico del tráfico web.

Otros recursos que podrían interesarte

Temas Virtualpro