logo móvil
Contáctanos

Dade-dqn: red dual y red dual del entorno de la red profunda q para mejorar la estrategia de comercio de acciones

Autores: Huang, Yuling; Lu, Xiaoping; Zhou, Chujin; Song, Yunlin

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Dade-dqn: red dual y red dual del entorno de la red profunda q para mejorar la estrategia de comercio de acciones


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Aprendizaje por refuerzo
Comercio de acciones
DRL
Red Q profunda
LSTM
Mecanismos de atención

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 31

Citaciones: Sin citaciones


Descripción
El aprendizaje profundo por refuerzo (DRL) ha atraído un gran interés desde que AlphaGo venció a profesionales humanos, y sus aplicaciones en el trading de acciones son amplias. En este documento, se propone una estrategia mejorada de trading de acciones llamada Red Neuronal Q-Dual de Acción Dual y Entorno Dual (DADE-DQN) para obtener beneficios y reducir el riesgo. Nuestro enfoque incorpora varios aspectos clave. En primer lugar, para lograr un mejor equilibrio entre la exploración y la explotación, se incorporan un mecanismo de selección de doble acción y un entorno dual en nuestro marco DQN. En segundo lugar, nuestro enfoque optimiza la utilización de transiciones de almacenamiento mediante el uso de memorias de reproducción independientes y realizando actualizaciones de doble mini-lote, lo que lleva a una convergencia más rápida y un aprendizaje más eficiente. En tercer lugar, se introduce una estructura de red neuronal profunda novedosa que incorpora Memoria a Corto y Largo Plazo (LSTM) y mecanismos de atención, mejorando así la capacidad de la red para capturar características y patrones esenciales. Además, se presenta un método innovador de selección de características para mejorar eficientemente los datos de entrada utilizando información mutua para identificar y eliminar características irrelevantes. La evaluación en seis conjuntos de datos muestra que nuestro algoritmo DADE-DQN supera a múltiples estrategias basadas en DRL (TDQN, DQN-Pattern, DQN-Vanilla) y estrategias tradicionales (B&H, S&H, MR, TF). Por ejemplo, en el conjunto de datos KS11, la estrategia DADE-DQN ha logrado un impresionante retorno acumulativo del 79.43% y un índice de Sharpe de 2.21, superando a todos los demás métodos. Estos resultados experimentales demuestran el rendimiento de nuestro enfoque en mejorar las estrategias de trading de acciones.

Otros recursos que podrían interesarte

Temas Virtualpro