Un nuevo método anti-riesgo para la negociación de carteras utilizando el aprendizaje profundo por refuerzo
Autores: Yue, Han; Liu, Jiapeng; Tian, Dongmei; Zhang, Qin
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un nuevo método anti-riesgo para la negociación de carteras utilizando el aprendizaje profundo por refuerzo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aprendizaje profundo por refuerzo
Gestión de carteras
Datos de series temporales financieras
Método de trading de carteras anti-riesgo
Algoritmo actor-critic
Actor-critic de ventaja
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
En la última década, la aplicación del aprendizaje profundo por refuerzo (DRL) en la gestión de carteras ha atraído una atención extensa. Sin embargo, la mayoría de los algoritmos de RL clásicos no consideran la exógena y el ruido de los datos de series temporales financieras, lo cual puede llevar a decisiones comerciales peligrosas. Para abordar este problema, proponemos un novedoso método de trading de cartera anti-riesgo basado en el aprendizaje profundo por refuerzo (DRL). Consiste en una red de autoencoders de denoising apilados (SSDAE) y un agente de aprendizaje por refuerzo (RL) basado en actor-critic. SSDAE llevará a cabo primero un entrenamiento fuera de línea, mientras que el decodificador se utilizará para la extracción de características en línea en cada estado. La red SSDAE se utiliza para el entrenamiento de resistencia al ruido de los datos financieros. El algoritmo actor-critic que utilizamos es el advantage actor-critic (A2C) y consta de dos redes: la red actor aprende e implementa una política de inversión, que luego es evaluada por la red crítica para determinar el mejor plan de acción redistribuyendo continuamente varios activos de la cartera, tomando el ratio de Sharpe como función de optimización. A través de experimentos extensos, los resultados muestran que nuestro método propuesto es efectivo y superior al índice del Dow Jones Industrial Average (DJIA), varias variantes de nuestro método propuesto y un método de vanguardia (SOTA).
Descripción
En la última década, la aplicación del aprendizaje profundo por refuerzo (DRL) en la gestión de carteras ha atraído una atención extensa. Sin embargo, la mayoría de los algoritmos de RL clásicos no consideran la exógena y el ruido de los datos de series temporales financieras, lo cual puede llevar a decisiones comerciales peligrosas. Para abordar este problema, proponemos un novedoso método de trading de cartera anti-riesgo basado en el aprendizaje profundo por refuerzo (DRL). Consiste en una red de autoencoders de denoising apilados (SSDAE) y un agente de aprendizaje por refuerzo (RL) basado en actor-critic. SSDAE llevará a cabo primero un entrenamiento fuera de línea, mientras que el decodificador se utilizará para la extracción de características en línea en cada estado. La red SSDAE se utiliza para el entrenamiento de resistencia al ruido de los datos financieros. El algoritmo actor-critic que utilizamos es el advantage actor-critic (A2C) y consta de dos redes: la red actor aprende e implementa una política de inversión, que luego es evaluada por la red crítica para determinar el mejor plan de acción redistribuyendo continuamente varios activos de la cartera, tomando el ratio de Sharpe como función de optimización. A través de experimentos extensos, los resultados muestran que nuestro método propuesto es efectivo y superior al índice del Dow Jones Industrial Average (DJIA), varias variantes de nuestro método propuesto y un método de vanguardia (SOTA).