Dade-dqn: red dual y red dual del entorno de la red profunda q para mejorar la estrategia de comercio de acciones

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Dade-dqn: red dual y red dual del entorno de la red profunda q para mejorar la estrategia de comercio de acciones

Autores: Huang, Yuling; Lu, Xiaoping; Zhou, Chujin; Song, Yunlin

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico

2023

Dade-dqn: red dual y red dual del entorno de la red profunda q para mejorar la estrategia de comercio de acciones

Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Aprendizaje por refuerzo

Comercio de acciones

DRL

Red Q profunda

LSTM

Mecanismos de atención

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 31

Citaciones: Sin citaciones

El aprendizaje profundo por refuerzo (DRL) ha atraído un gran interés desde que AlphaGo venció a profesionales humanos, y sus aplicaciones en el trading de acciones son amplias. En este documento, se propone una estrategia mejorada de trading de acciones llamada Red Neuronal Q-Dual de Acción Dual y Entorno Dual (DADE-DQN) para obtener beneficios y reducir el riesgo. Nuestro enfoque incorpora varios aspectos clave. En primer lugar, para lograr un mejor equilibrio entre la exploración y la explotación, se incorporan un mecanismo de selección de doble acción y un entorno dual en nuestro marco DQN. En segundo lugar, nuestro enfoque optimiza la utilización de transiciones de almacenamiento mediante el uso de memorias de reproducción independientes y realizando actualizaciones de doble mini-lote, lo que lleva a una convergencia más rápida y un aprendizaje más eficiente. En tercer lugar, se introduce una estructura de red neuronal profunda novedosa que incorpora Memoria a Corto y Largo Plazo (LSTM) y mecanismos de atención, mejorando así la capacidad de la red para capturar características y patrones esenciales. Además, se presenta un método innovador de selección de características para mejorar eficientemente los datos de entrada utilizando información mutua para identificar y eliminar características irrelevantes. La evaluación en seis conjuntos de datos muestra que nuestro algoritmo DADE-DQN supera a múltiples estrategias basadas en DRL (TDQN, DQN-Pattern, DQN-Vanilla) y estrategias tradicionales (B&H, S&H, MR, TF). Por ejemplo, en el conjunto de datos KS11, la estrategia DADE-DQN ha logrado un impresionante retorno acumulativo del 79.43% y un índice de Sharpe de 2.21, superando a todos los demás métodos. Estos resultados experimentales demuestran el rendimiento de nuestro enfoque en mejorar las estrategias de trading de acciones.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro