Gestión de Cartera de Acciones mediante el Uso de un Algoritmo de Aprendizaje por Refuerzo Profundo Enjuntado Difuso
Autores: Hao, Zheng; Zhang, Haowei; Zhang, Yipu
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Gestión de Cartera de Acciones mediante el Uso de un Algoritmo de Aprendizaje por Refuerzo Profundo Enjuntado Difuso
Categoría
Gestión y administración
Subcategoría
Gestión de recursos
Palabras clave
Objetivo de investigación
Agente informático
Estrategias de negociación
Negociación de acciones
Aprendizaje por refuerzo
Gestión de cartera de acciones
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
El objetivo de la investigación de este artículo es entrenar a una computadora (agente) con datos de información del mercado para que pueda aprender estrategias de trading y superar el índice del mercado en el comercio de acciones sin tener que hacer ninguna predicción sobre los movimientos del mercado. El enfoque asume que no hay conocimiento de trading, por lo que el agente solo aprenderá al realizar operaciones con datos históricos. En este trabajo, abordamos esta tarea considerando algoritmos de Aprendizaje por Refuerzo (RL) para la gestión de carteras de acciones. Primero generamos un vector difuso tridimensional para describir la tendencia actual de cada acción. Luego, los términos difusos, junto con otras características del mercado de valores, como precios, volúmenes e indicadores técnicos, se utilizaron como entrada para cinco algoritmos, incluidos Advantage Actor-Critic, Trust Region Policy Optimization, Proximal Policy Optimization, Actor-Critic Using Kronecker Factored Trust Region y Deep Deterministic Policy Gradient. Se aplicó un método de ensamblaje promedio para obtener acciones de trading. Establecimos las acciones componentes del SP100 como el grupo de cartera y utilizamos 11 años de datos diarios para entrenar el modelo y simular el trading. Nuestro método demostró un mejor rendimiento que los dos métodos de referencia y cada algoritmo individual sin extensión difusa. En la práctica, los traders del mercado real podrían usar el modelo entrenado para hacer inferencias y realizar trading, y luego volver a entrenar el modelo de vez en cuando, ya que entrenar tales modelos consume tiempo, pero hacer inferencias es casi simultáneo.
Descripción
El objetivo de la investigación de este artículo es entrenar a una computadora (agente) con datos de información del mercado para que pueda aprender estrategias de trading y superar el índice del mercado en el comercio de acciones sin tener que hacer ninguna predicción sobre los movimientos del mercado. El enfoque asume que no hay conocimiento de trading, por lo que el agente solo aprenderá al realizar operaciones con datos históricos. En este trabajo, abordamos esta tarea considerando algoritmos de Aprendizaje por Refuerzo (RL) para la gestión de carteras de acciones. Primero generamos un vector difuso tridimensional para describir la tendencia actual de cada acción. Luego, los términos difusos, junto con otras características del mercado de valores, como precios, volúmenes e indicadores técnicos, se utilizaron como entrada para cinco algoritmos, incluidos Advantage Actor-Critic, Trust Region Policy Optimization, Proximal Policy Optimization, Actor-Critic Using Kronecker Factored Trust Region y Deep Deterministic Policy Gradient. Se aplicó un método de ensamblaje promedio para obtener acciones de trading. Establecimos las acciones componentes del SP100 como el grupo de cartera y utilizamos 11 años de datos diarios para entrenar el modelo y simular el trading. Nuestro método demostró un mejor rendimiento que los dos métodos de referencia y cada algoritmo individual sin extensión difusa. En la práctica, los traders del mercado real podrían usar el modelo entrenado para hacer inferencias y realizar trading, y luego volver a entrenar el modelo de vez en cuando, ya que entrenar tales modelos consume tiempo, pero hacer inferencias es casi simultáneo.