Gestión de Cartera de Acciones mediante el Uso de un Algoritmo de Aprendizaje por Refuerzo Profundo Enjuntado Difuso

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Gestión de Cartera de Acciones mediante el Uso de un Algoritmo de Aprendizaje por Refuerzo Profundo Enjuntado Difuso

Autores: Hao, Zheng; Zhang, Haowei; Zhang, Yipu

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico

2023

Gestión de Cartera de Acciones mediante el Uso de un Algoritmo de Aprendizaje por Refuerzo Profundo Enjuntado Difuso

Categoría

Gestión y administración

Subcategoría

Gestión de recursos

Palabras clave

Objetivo de investigación

Agente informático

Estrategias de negociación

Negociación de acciones

Aprendizaje por refuerzo

Gestión de cartera de acciones

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 19

Citaciones: Sin citaciones

El objetivo de la investigación de este artículo es entrenar a una computadora (agente) con datos de información del mercado para que pueda aprender estrategias de trading y superar el índice del mercado en el comercio de acciones sin tener que hacer ninguna predicción sobre los movimientos del mercado. El enfoque asume que no hay conocimiento de trading, por lo que el agente solo aprenderá al realizar operaciones con datos históricos. En este trabajo, abordamos esta tarea considerando algoritmos de Aprendizaje por Refuerzo (RL) para la gestión de carteras de acciones. Primero generamos un vector difuso tridimensional para describir la tendencia actual de cada acción. Luego, los términos difusos, junto con otras características del mercado de valores, como precios, volúmenes e indicadores técnicos, se utilizaron como entrada para cinco algoritmos, incluidos Advantage Actor-Critic, Trust Region Policy Optimization, Proximal Policy Optimization, Actor-Critic Using Kronecker Factored Trust Region y Deep Deterministic Policy Gradient. Se aplicó un método de ensamblaje promedio para obtener acciones de trading. Establecimos las acciones componentes del SP100 como el grupo de cartera y utilizamos 11 años de datos diarios para entrenar el modelo y simular el trading. Nuestro método demostró un mejor rendimiento que los dos métodos de referencia y cada algoritmo individual sin extensión difusa. En la práctica, los traders del mercado real podrían usar el modelo entrenado para hacer inferencias y realizar trading, y luego volver a entrenar el modelo de vez en cuando, ya que entrenar tales modelos consume tiempo, pero hacer inferencias es casi simultáneo.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro