Un modelo de cartera con política de control de riesgos basada en aprendizaje profundo por refuerzo
Autores: Jiang, Caiyu; Wang, Jianhua
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un modelo de cartera con política de control de riesgos basada en aprendizaje profundo por refuerzo
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Aprendizaje profundo por refuerzo
Gestión de carteras
Algoritmo de gradiente de política determinista profunda retrasada gemela
Control de riesgos
Trading financiero
Modelo de cartera
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
Se ha demostrado que el aprendizaje profundo por refuerzo (DRL) tiene el potencial de resolver problemas de gestión de carteras en los últimos años. El algoritmo de gradiente de política determinista profunda retardada gemela (TD3) es un método actor-crítico, un método DRL típico en un espacio de acción continuo. A pesar del éxito de DRL en el trading financiero, sorprendentemente, la mayoría de la literatura ignora el elemento de control de riesgos. La investigación propone combinar el control de riesgos a largo y corto plazo (LSTR) con el algoritmo TD3 para construir un modelo de cartera con capacidades de gestión de riesgos. Utilizando datos de acciones chinas de la Bolsa de Valores de Shanghái, entrenamos y validamos el modelo de cartera propuesto. Se compararon los rendimientos con el modelo TD3 sin control de riesgos. Los resultados indicaron que nuestra propuesta ofrece un mejor control de riesgos y rendimientos de inversión.
Descripción
Se ha demostrado que el aprendizaje profundo por refuerzo (DRL) tiene el potencial de resolver problemas de gestión de carteras en los últimos años. El algoritmo de gradiente de política determinista profunda retardada gemela (TD3) es un método actor-crítico, un método DRL típico en un espacio de acción continuo. A pesar del éxito de DRL en el trading financiero, sorprendentemente, la mayoría de la literatura ignora el elemento de control de riesgos. La investigación propone combinar el control de riesgos a largo y corto plazo (LSTR) con el algoritmo TD3 para construir un modelo de cartera con capacidades de gestión de riesgos. Utilizando datos de acciones chinas de la Bolsa de Valores de Shanghái, entrenamos y validamos el modelo de cartera propuesto. Se compararon los rendimientos con el modelo TD3 sin control de riesgos. Los resultados indicaron que nuestra propuesta ofrece un mejor control de riesgos y rendimientos de inversión.