Optimizando sistemas de trading automatizado con aprendizaje profundo por refuerzo
Autores: Tran, Minh; Pham-Hi, Duc; Bui, Marc
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Optimizando sistemas de trading automatizado con aprendizaje profundo por refuerzo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Enfoque
Parámetros
Aprendizaje por refuerzo
Sistema de trading
Optimización
Estrategias
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
En este trabajo, proponemos un enfoque novedoso para optimizar parámetros para estrategias en sistemas de trading automatizados. Basado en el marco de Aprendizaje por Refuerzo, nuestro trabajo incluye el desarrollo de un entorno de aprendizaje, representación de estados, función de recompensa y algoritmo de aprendizaje para el mercado de criptomonedas. Considerando dos funciones objetivo simples, retorno acumulativo y ratio de Sharpe, los resultados mostraron que el enfoque de Aprendizaje por Refuerzo Profundo con la configuración de Doble Red Q profunda y el enfoque de Optimización Bayesiana pueden proporcionar retornos promedio positivos. Entre las configuraciones estudiadas, la configuración de Doble Red Q profunda con el ratio de Sharpe como función de recompensa es el mejor sistema de trading de Q-learning. Con un objetivo de trading diario, el sistema muestra resultados superiores en términos de retorno acumulativo, volatilidad y tiempo de ejecución en comparación con el enfoque de Optimización Bayesiana. Esto ayuda a los traders a tomar decisiones rápidas y eficientes con la información más reciente del mercado. En el trading a largo plazo, la Optimización Bayesiana es un método de optimización de parámetros que genera mayores beneficios. El Aprendizaje por Refuerzo Profundo proporciona soluciones al problema de alta dimensionalidad de la Optimización Bayesiana en estudios futuros como la optimización de carteras con múltiples activos y diversas estrategias de trading.
Descripción
En este trabajo, proponemos un enfoque novedoso para optimizar parámetros para estrategias en sistemas de trading automatizados. Basado en el marco de Aprendizaje por Refuerzo, nuestro trabajo incluye el desarrollo de un entorno de aprendizaje, representación de estados, función de recompensa y algoritmo de aprendizaje para el mercado de criptomonedas. Considerando dos funciones objetivo simples, retorno acumulativo y ratio de Sharpe, los resultados mostraron que el enfoque de Aprendizaje por Refuerzo Profundo con la configuración de Doble Red Q profunda y el enfoque de Optimización Bayesiana pueden proporcionar retornos promedio positivos. Entre las configuraciones estudiadas, la configuración de Doble Red Q profunda con el ratio de Sharpe como función de recompensa es el mejor sistema de trading de Q-learning. Con un objetivo de trading diario, el sistema muestra resultados superiores en términos de retorno acumulativo, volatilidad y tiempo de ejecución en comparación con el enfoque de Optimización Bayesiana. Esto ayuda a los traders a tomar decisiones rápidas y eficientes con la información más reciente del mercado. En el trading a largo plazo, la Optimización Bayesiana es un método de optimización de parámetros que genera mayores beneficios. El Aprendizaje por Refuerzo Profundo proporciona soluciones al problema de alta dimensionalidad de la Optimización Bayesiana en estudios futuros como la optimización de carteras con múltiples activos y diversas estrategias de trading.