Selección de variables en pronósticos de series temporales utilizando bosques aleatorios
Autores: Tyralis, Hristos; Papacharalampous, Georgia
Idioma: Inglés
Editor: MDPI
Año: 2017
Acceso abierto
Artículo científico
2017
Selección de variables en pronósticos de series temporales utilizando bosques aleatorios
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Series de tiempo
Algoritmos de aprendizaje automático
Bosque aleatorio
Variables predictoras
Rendimiento
Métodos de referencia
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
La predicción de series temporales utilizando algoritmos de aprendizaje automático ha ganado popularidad recientemente. RandomForest es un algoritmo de aprendizaje automático implementado en la predicción de series temporales; sin embargo, la mayoría de sus propiedades de predicción han permanecido inexploradas. Aquí nos centramos en evaluar el rendimiento de los bosques aleatorios en la predicción de un paso utilizando dos grandes conjuntos de datos de series temporales cortas con el objetivo de sugerir un conjunto óptimo de variables predictoras. Además, comparamos su rendimiento con métodos de referencia. El primer conjunto de datos está compuesto por 16,000 series temporales simuladas de una variedad de modelos Autoregresivos Integrados Moving Average Fractionally (ARFIMA). El segundo conjunto de datos consiste en 135 series temporales de temperatura media anual. El mejor rendimiento predictivo de RF se observa al utilizar un bajo número de variables predictoras rezagadas recientes. Este resultado podría ser útil en aplicaciones futuras relevantes, con la perspectiva de lograr una mayor precisión predictiva.
Descripción
La predicción de series temporales utilizando algoritmos de aprendizaje automático ha ganado popularidad recientemente. RandomForest es un algoritmo de aprendizaje automático implementado en la predicción de series temporales; sin embargo, la mayoría de sus propiedades de predicción han permanecido inexploradas. Aquí nos centramos en evaluar el rendimiento de los bosques aleatorios en la predicción de un paso utilizando dos grandes conjuntos de datos de series temporales cortas con el objetivo de sugerir un conjunto óptimo de variables predictoras. Además, comparamos su rendimiento con métodos de referencia. El primer conjunto de datos está compuesto por 16,000 series temporales simuladas de una variedad de modelos Autoregresivos Integrados Moving Average Fractionally (ARFIMA). El segundo conjunto de datos consiste en 135 series temporales de temperatura media anual. El mejor rendimiento predictivo de RF se observa al utilizar un bajo número de variables predictoras rezagadas recientes. Este resultado podría ser útil en aplicaciones futuras relevantes, con la perspectiva de lograr una mayor precisión predictiva.