Arquitectura inspirada en DeepONet para una predicción eficiente de series temporales financieras
Autores: Ahmad, Zeeshan; Bao, Shudi; Chen, Meng
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Arquitectura inspirada en DeepONet para una predicción eficiente de series temporales financieras
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Predicción de series temporales financieras
Modelos de aprendizaje profundo
LSTM
CNN
Red de Operadores Profundos
Modelo CLT
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
La predicción de series temporales financieras es un problema fundamental en la inversión y la gestión de riesgos. Los modelos de aprendizaje profundo, como los perceptrones multicapa, las Redes Neuronales Convolucionales (CNN) y la Memoria a Corto y Largo Plazo (LSTM), se han utilizado ampliamente en la modelización de datos de series temporales al incorporar información histórica. Entre ellos, LSTM ha mostrado un excelente rendimiento en la captura de dependencias temporales a largo plazo en los datos de series temporales, gracias a su mecanismo de memoria interna mejorado. A pesar del éxito de estos modelos, se observa que en presencia de puntos de cambio bruscos, estos modelos no logran rendir. Para abordar este problema, proponemos, en este artículo, un método innovador de predicción de series temporales financieras inspirado en la arquitectura de la Red de Operadores Profundos (DeepONet), que utiliza una combinación de la arquitectura de transformadores y una red CNN unidimensional para procesar información basada en características, seguida de una red basada en LSTM para procesar información temporal. Por lo tanto, se denomina el modelo CNN-LSTM-Transformer (CLT). No solo incorpora información externa para identificar patrones latentes dentro de los datos financieros, sino que también destaca en capturar sus dinámicas temporales. El modelo CLT se adapta a las condiciones del mercado en evolución aprovechando diversas técnicas de aprendizaje profundo. Esta adaptación dinámica del modelo CLT desempeña un papel fundamental en la navegación de cambios abruptos en los mercados financieros. Además, el modelo CLT mejora la precisión y estabilidad de la predicción a largo plazo en comparación con los modelos de aprendizaje profundo existentes de última generación y también mitiga los efectos adversos de la volatilidad del mercado. Los resultados experimentales muestran la viabilidad y superioridad del modelo CLT propuesto en términos de precisión de predicción y robustez en comparación con los modelos de predicción existentes. Además, afirmamos que la innovación encapsulada en el modelo CLT inspirado en DeepONet propuesto también tiene potencial para aplicaciones más allá de las finanzas, como la teledetección, la minería de datos, el procesamiento de lenguaje natural, entre otros.
Descripción
La predicción de series temporales financieras es un problema fundamental en la inversión y la gestión de riesgos. Los modelos de aprendizaje profundo, como los perceptrones multicapa, las Redes Neuronales Convolucionales (CNN) y la Memoria a Corto y Largo Plazo (LSTM), se han utilizado ampliamente en la modelización de datos de series temporales al incorporar información histórica. Entre ellos, LSTM ha mostrado un excelente rendimiento en la captura de dependencias temporales a largo plazo en los datos de series temporales, gracias a su mecanismo de memoria interna mejorado. A pesar del éxito de estos modelos, se observa que en presencia de puntos de cambio bruscos, estos modelos no logran rendir. Para abordar este problema, proponemos, en este artículo, un método innovador de predicción de series temporales financieras inspirado en la arquitectura de la Red de Operadores Profundos (DeepONet), que utiliza una combinación de la arquitectura de transformadores y una red CNN unidimensional para procesar información basada en características, seguida de una red basada en LSTM para procesar información temporal. Por lo tanto, se denomina el modelo CNN-LSTM-Transformer (CLT). No solo incorpora información externa para identificar patrones latentes dentro de los datos financieros, sino que también destaca en capturar sus dinámicas temporales. El modelo CLT se adapta a las condiciones del mercado en evolución aprovechando diversas técnicas de aprendizaje profundo. Esta adaptación dinámica del modelo CLT desempeña un papel fundamental en la navegación de cambios abruptos en los mercados financieros. Además, el modelo CLT mejora la precisión y estabilidad de la predicción a largo plazo en comparación con los modelos de aprendizaje profundo existentes de última generación y también mitiga los efectos adversos de la volatilidad del mercado. Los resultados experimentales muestran la viabilidad y superioridad del modelo CLT propuesto en términos de precisión de predicción y robustez en comparación con los modelos de predicción existentes. Además, afirmamos que la innovación encapsulada en el modelo CLT inspirado en DeepONet propuesto también tiene potencial para aplicaciones más allá de las finanzas, como la teledetección, la minería de datos, el procesamiento de lenguaje natural, entre otros.