logo móvil
Contáctanos

Gestión de Cartera de Acciones mediante el Uso de un Algoritmo de Aprendizaje por Refuerzo Profundo Enjuntado Difuso

Autores: Hao, Zheng; Zhang, Haowei; Zhang, Yipu

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Gestión de Cartera de Acciones mediante el Uso de un Algoritmo de Aprendizaje por Refuerzo Profundo Enjuntado Difuso


Categoría

Gestión y administración

Subcategoría

Gestión de recursos

Palabras clave

Objetivo de investigación
Agente informático
Estrategias de negociación
Negociación de acciones
Aprendizaje por refuerzo
Gestión de cartera de acciones

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 19

Citaciones: Sin citaciones


Descripción
El objetivo de la investigación de este artículo es entrenar a una computadora (agente) con datos de información del mercado para que pueda aprender estrategias de trading y superar el índice del mercado en el comercio de acciones sin tener que hacer ninguna predicción sobre los movimientos del mercado. El enfoque asume que no hay conocimiento de trading, por lo que el agente solo aprenderá al realizar operaciones con datos históricos. En este trabajo, abordamos esta tarea considerando algoritmos de Aprendizaje por Refuerzo (RL) para la gestión de carteras de acciones. Primero generamos un vector difuso tridimensional para describir la tendencia actual de cada acción. Luego, los términos difusos, junto con otras características del mercado de valores, como precios, volúmenes e indicadores técnicos, se utilizaron como entrada para cinco algoritmos, incluidos Advantage Actor-Critic, Trust Region Policy Optimization, Proximal Policy Optimization, Actor-Critic Using Kronecker Factored Trust Region y Deep Deterministic Policy Gradient. Se aplicó un método de ensamblaje promedio para obtener acciones de trading. Establecimos las acciones componentes del SP100 como el grupo de cartera y utilizamos 11 años de datos diarios para entrenar el modelo y simular el trading. Nuestro método demostró un mejor rendimiento que los dos métodos de referencia y cada algoritmo individual sin extensión difusa. En la práctica, los traders del mercado real podrían usar el modelo entrenado para hacer inferencias y realizar trading, y luego volver a entrenar el modelo de vez en cuando, ya que entrenar tales modelos consume tiempo, pero hacer inferencias es casi simultáneo.

Otros recursos que podrían interesarte

Temas Virtualpro