Dade-dqn: red dual y red dual del entorno de la red profunda q para mejorar la estrategia de comercio de acciones
Autores: Huang, Yuling; Lu, Xiaoping; Zhou, Chujin; Song, Yunlin
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Dade-dqn: red dual y red dual del entorno de la red profunda q para mejorar la estrategia de comercio de acciones
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Aprendizaje por refuerzo
Comercio de acciones
DRL
Red Q profunda
LSTM
Mecanismos de atención
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
El aprendizaje profundo por refuerzo (DRL) ha atraído un gran interés desde que AlphaGo venció a profesionales humanos, y sus aplicaciones en el trading de acciones son amplias. En este documento, se propone una estrategia mejorada de trading de acciones llamada Red Neuronal Q-Dual de Acción Dual y Entorno Dual (DADE-DQN) para obtener beneficios y reducir el riesgo. Nuestro enfoque incorpora varios aspectos clave. En primer lugar, para lograr un mejor equilibrio entre la exploración y la explotación, se incorporan un mecanismo de selección de doble acción y un entorno dual en nuestro marco DQN. En segundo lugar, nuestro enfoque optimiza la utilización de transiciones de almacenamiento mediante el uso de memorias de reproducción independientes y realizando actualizaciones de doble mini-lote, lo que lleva a una convergencia más rápida y un aprendizaje más eficiente. En tercer lugar, se introduce una estructura de red neuronal profunda novedosa que incorpora Memoria a Corto y Largo Plazo (LSTM) y mecanismos de atención, mejorando así la capacidad de la red para capturar características y patrones esenciales. Además, se presenta un método innovador de selección de características para mejorar eficientemente los datos de entrada utilizando información mutua para identificar y eliminar características irrelevantes. La evaluación en seis conjuntos de datos muestra que nuestro algoritmo DADE-DQN supera a múltiples estrategias basadas en DRL (TDQN, DQN-Pattern, DQN-Vanilla) y estrategias tradicionales (B&H, S&H, MR, TF). Por ejemplo, en el conjunto de datos KS11, la estrategia DADE-DQN ha logrado un impresionante retorno acumulativo del 79.43% y un índice de Sharpe de 2.21, superando a todos los demás métodos. Estos resultados experimentales demuestran el rendimiento de nuestro enfoque en mejorar las estrategias de trading de acciones.
Descripción
El aprendizaje profundo por refuerzo (DRL) ha atraído un gran interés desde que AlphaGo venció a profesionales humanos, y sus aplicaciones en el trading de acciones son amplias. En este documento, se propone una estrategia mejorada de trading de acciones llamada Red Neuronal Q-Dual de Acción Dual y Entorno Dual (DADE-DQN) para obtener beneficios y reducir el riesgo. Nuestro enfoque incorpora varios aspectos clave. En primer lugar, para lograr un mejor equilibrio entre la exploración y la explotación, se incorporan un mecanismo de selección de doble acción y un entorno dual en nuestro marco DQN. En segundo lugar, nuestro enfoque optimiza la utilización de transiciones de almacenamiento mediante el uso de memorias de reproducción independientes y realizando actualizaciones de doble mini-lote, lo que lleva a una convergencia más rápida y un aprendizaje más eficiente. En tercer lugar, se introduce una estructura de red neuronal profunda novedosa que incorpora Memoria a Corto y Largo Plazo (LSTM) y mecanismos de atención, mejorando así la capacidad de la red para capturar características y patrones esenciales. Además, se presenta un método innovador de selección de características para mejorar eficientemente los datos de entrada utilizando información mutua para identificar y eliminar características irrelevantes. La evaluación en seis conjuntos de datos muestra que nuestro algoritmo DADE-DQN supera a múltiples estrategias basadas en DRL (TDQN, DQN-Pattern, DQN-Vanilla) y estrategias tradicionales (B&H, S&H, MR, TF). Por ejemplo, en el conjunto de datos KS11, la estrategia DADE-DQN ha logrado un impresionante retorno acumulativo del 79.43% y un índice de Sharpe de 2.21, superando a todos los demás métodos. Estos resultados experimentales demuestran el rendimiento de nuestro enfoque en mejorar las estrategias de trading de acciones.