Un método de aprendizaje profundo para la detección y compensación de eventos atípicos en datos de acciones
Autores: Naidoo, Vashalen; Du, Shengzhi
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un método de aprendizaje profundo para la detección y compensación de eventos atípicos en datos de acciones
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Precio de las acciones
Anomalías
Precisión de pronóstico
Datos de series temporales
Valores atípicos
Aprendizaje automático
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
El precio de las acciones es el resultado de numerosos factores que no son necesariamente cuantificables y se ven significativamente afectados por anomalías. La precisión en la predicción de los precios de las acciones se ve negativamente afectada por estas anomalías. Sin embargo, hay muy pocos métodos disponibles para detectar, modelar y compensar anomalías en series temporales financieras dadas las funciones críticas de un mejor manejo de fondos y una predicción precisa de anomalías. Los datos de series temporales son un tipo de datos que cambia a lo largo de un intervalo de tiempo definido. Cada valor en el conjunto de datos tiene alguna relación con los valores anteriores en la serie. Esta característica de los datos de series temporales nos permite predecir los valores que seguirán en la serie. Los modelos de predicción típicos se limitan a seguir los patrones en el conjunto de datos sin poder compensar los períodos anómalos. Este estudio intentará encontrar un método de aprendizaje automático para detectar valores atípicos y luego compensar estas detecciones en la predicción realizada. Este concepto no se había implementado previamente, por lo tanto, se hará uso de trabajos teóricos sobre pronóstico de mercado, valores atípicos y sus efectos, y métodos de aprendizaje automático. Las ideas implementadas en el documento se basan en la hipótesis del mercado eficiente (EMH), en la cual el precio de las acciones refleja el conocimiento sobre el mercado. La hipótesis EMH no puede tener en cuenta el sentimiento del consumidor hacia una acción. Este sentimiento podría producir anomalías en los datos de las acciones que tienen una influencia significativa en el movimiento del mercado bursátil. Por lo tanto, la detección y compensación de valores atípicos pueden mejorar las predicciones realizadas sobre los movimientos de las acciones. Este documento propone un método de aprendizaje profundo que consta de dos etapas secuenciales. La primera etapa es un modelo de detección de valores atípicos basado en una red auto-codificadora de memoria a corto y largo plazo (LSTM) que puede determinar si ha ocurrido un evento atípico y luego crear un valor asociado a esta ocurrencia para la siguiente etapa. La segunda etapa del método propuesto utiliza un modelo de red neuronal de orden superior (HONN) para hacer una predicción basada en la salida de la primera etapa y los datos de series temporales de acciones. Se utilizan datos reales de acciones y modelos de predicción independientes para validar este método. Este método es superior en la predicción de datos de series temporales de acciones al compensar eventos atípicos. La mejora es cuantificable si el conjunto de datos contiene una cantidad adecuada de períodos anómalos. Podríamos aplicar además el método propuesto de compensación de valores atípicos en combinación con otros métodos de predicción de series temporales financieras para ofrecer más mejoras y estabilidad.
Descripción
El precio de las acciones es el resultado de numerosos factores que no son necesariamente cuantificables y se ven significativamente afectados por anomalías. La precisión en la predicción de los precios de las acciones se ve negativamente afectada por estas anomalías. Sin embargo, hay muy pocos métodos disponibles para detectar, modelar y compensar anomalías en series temporales financieras dadas las funciones críticas de un mejor manejo de fondos y una predicción precisa de anomalías. Los datos de series temporales son un tipo de datos que cambia a lo largo de un intervalo de tiempo definido. Cada valor en el conjunto de datos tiene alguna relación con los valores anteriores en la serie. Esta característica de los datos de series temporales nos permite predecir los valores que seguirán en la serie. Los modelos de predicción típicos se limitan a seguir los patrones en el conjunto de datos sin poder compensar los períodos anómalos. Este estudio intentará encontrar un método de aprendizaje automático para detectar valores atípicos y luego compensar estas detecciones en la predicción realizada. Este concepto no se había implementado previamente, por lo tanto, se hará uso de trabajos teóricos sobre pronóstico de mercado, valores atípicos y sus efectos, y métodos de aprendizaje automático. Las ideas implementadas en el documento se basan en la hipótesis del mercado eficiente (EMH), en la cual el precio de las acciones refleja el conocimiento sobre el mercado. La hipótesis EMH no puede tener en cuenta el sentimiento del consumidor hacia una acción. Este sentimiento podría producir anomalías en los datos de las acciones que tienen una influencia significativa en el movimiento del mercado bursátil. Por lo tanto, la detección y compensación de valores atípicos pueden mejorar las predicciones realizadas sobre los movimientos de las acciones. Este documento propone un método de aprendizaje profundo que consta de dos etapas secuenciales. La primera etapa es un modelo de detección de valores atípicos basado en una red auto-codificadora de memoria a corto y largo plazo (LSTM) que puede determinar si ha ocurrido un evento atípico y luego crear un valor asociado a esta ocurrencia para la siguiente etapa. La segunda etapa del método propuesto utiliza un modelo de red neuronal de orden superior (HONN) para hacer una predicción basada en la salida de la primera etapa y los datos de series temporales de acciones. Se utilizan datos reales de acciones y modelos de predicción independientes para validar este método. Este método es superior en la predicción de datos de series temporales de acciones al compensar eventos atípicos. La mejora es cuantificable si el conjunto de datos contiene una cantidad adecuada de períodos anómalos. Podríamos aplicar además el método propuesto de compensación de valores atípicos en combinación con otros métodos de predicción de series temporales financieras para ofrecer más mejoras y estabilidad.