Un nuevo método anti-riesgo para la negociación de carteras utilizando el aprendizaje profundo por refuerzo

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Un nuevo método anti-riesgo para la negociación de carteras utilizando el aprendizaje profundo por refuerzo

Autores: Yue, Han; Liu, Jiapeng; Tian, Dongmei; Zhang, Qin

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico

2022

Un nuevo método anti-riesgo para la negociación de carteras utilizando el aprendizaje profundo por refuerzo

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Aprendizaje profundo por refuerzo

Gestión de carteras

Datos de series temporales financieras

Método de trading de carteras anti-riesgo

Algoritmo actor-critic

Actor-critic de ventaja

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 30

Citaciones: Sin citaciones

En la última década, la aplicación del aprendizaje profundo por refuerzo (DRL) en la gestión de carteras ha atraído una atención extensa. Sin embargo, la mayoría de los algoritmos de RL clásicos no consideran la exógena y el ruido de los datos de series temporales financieras, lo cual puede llevar a decisiones comerciales peligrosas. Para abordar este problema, proponemos un novedoso método de trading de cartera anti-riesgo basado en el aprendizaje profundo por refuerzo (DRL). Consiste en una red de autoencoders de denoising apilados (SSDAE) y un agente de aprendizaje por refuerzo (RL) basado en actor-critic. SSDAE llevará a cabo primero un entrenamiento fuera de línea, mientras que el decodificador se utilizará para la extracción de características en línea en cada estado. La red SSDAE se utiliza para el entrenamiento de resistencia al ruido de los datos financieros. El algoritmo actor-critic que utilizamos es el advantage actor-critic (A2C) y consta de dos redes: la red actor aprende e implementa una política de inversión, que luego es evaluada por la red crítica para determinar el mejor plan de acción redistribuyendo continuamente varios activos de la cartera, tomando el ratio de Sharpe como función de optimización. A través de experimentos extensos, los resultados muestran que nuestro método propuesto es efectivo y superior al índice del Dow Jones Industrial Average (DJIA), varias variantes de nuestro método propuesto y un método de vanguardia (SOTA).

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro