Evaluación de Modelos de Aprendizaje Automático de Conjuntos Basados en Árboles en la Predicción de la Dirección del Movimiento del Precio de las Acciones
Autores: Ampomah, Ernest Kwame; Qin, Zhiguang; Nyame, Gabriel
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Evaluación de Modelos de Aprendizaje Automático de Conjuntos Basados en Árboles en la Predicción de la Dirección del Movimiento del Precio de las Acciones
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Pronósticos
Precio de acciones
Riesgo de inversión
Modelos de aprendizaje automático
Modelos de conjunto
Clasificadores basados en árboles
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Predecir la dirección y la tendencia del precio de las acciones es una tarea importante que ayuda a los inversores a tomar decisiones financieras prudentes en el mercado de valores. La inversión en el mercado de valores conlleva un gran riesgo asociado. Minimizar el error de predicción reduce el riesgo de inversión. Los modelos de aprendizaje automático (ML) suelen tener un mejor rendimiento que los modelos estadísticos y econométricos. Además, se ha demostrado en la literatura que los modelos de ML en conjunto pueden producir un rendimiento superior al de los modelos de ML individuales. En este trabajo, comparamos la efectividad de los modelos de ML en conjunto basados en árboles (Random Forest (RF), XGBoost Classifier (XG), Bagging Classifier (BC), AdaBoost Classifier (Ada), Extra Trees Classifier (ET) y Voting Classifier (VC)) en la predicción de la dirección del movimiento del precio de las acciones. Se recopilan aleatoriamente ocho datos de acciones de tres bolsas de valores (NYSE, NASDAQ y NSE) y se utilizan para el estudio. Cada conjunto de datos se divide en un conjunto de entrenamiento y un conjunto de prueba. Se utiliza la precisión de validación cruzada de diez pliegues para evaluar los modelos de ML en el conjunto de entrenamiento. Además, los modelos de ML se evalúan en el conjunto de prueba utilizando precisión, exactitud, recuperación, puntuación F1, especificidad y área bajo la curva de características operativas del receptor (AUC-ROC). Se utiliza la prueba de concordancia de Kendall W para clasificar el rendimiento de los algoritmos de ML basados en árboles. Para el conjunto de entrenamiento, el modelo AdaBoost tuvo un mejor rendimiento que el resto de los modelos. Para el conjunto de prueba, las métricas de precisión, exactitud, puntuación F1 y AUC generaron resultados significativos para clasificar los modelos, y el clasificador Extra Trees superó a los otros modelos en todos los rankings.
Descripción
Predecir la dirección y la tendencia del precio de las acciones es una tarea importante que ayuda a los inversores a tomar decisiones financieras prudentes en el mercado de valores. La inversión en el mercado de valores conlleva un gran riesgo asociado. Minimizar el error de predicción reduce el riesgo de inversión. Los modelos de aprendizaje automático (ML) suelen tener un mejor rendimiento que los modelos estadísticos y econométricos. Además, se ha demostrado en la literatura que los modelos de ML en conjunto pueden producir un rendimiento superior al de los modelos de ML individuales. En este trabajo, comparamos la efectividad de los modelos de ML en conjunto basados en árboles (Random Forest (RF), XGBoost Classifier (XG), Bagging Classifier (BC), AdaBoost Classifier (Ada), Extra Trees Classifier (ET) y Voting Classifier (VC)) en la predicción de la dirección del movimiento del precio de las acciones. Se recopilan aleatoriamente ocho datos de acciones de tres bolsas de valores (NYSE, NASDAQ y NSE) y se utilizan para el estudio. Cada conjunto de datos se divide en un conjunto de entrenamiento y un conjunto de prueba. Se utiliza la precisión de validación cruzada de diez pliegues para evaluar los modelos de ML en el conjunto de entrenamiento. Además, los modelos de ML se evalúan en el conjunto de prueba utilizando precisión, exactitud, recuperación, puntuación F1, especificidad y área bajo la curva de características operativas del receptor (AUC-ROC). Se utiliza la prueba de concordancia de Kendall W para clasificar el rendimiento de los algoritmos de ML basados en árboles. Para el conjunto de entrenamiento, el modelo AdaBoost tuvo un mejor rendimiento que el resto de los modelos. Para el conjunto de prueba, las métricas de precisión, exactitud, puntuación F1 y AUC generaron resultados significativos para clasificar los modelos, y el clasificador Extra Trees superó a los otros modelos en todos los rankings.