Aprendizaje por Refuerzo en el Comercio de Pares: Un Enfoque de Escalado Dinámico
Autores: Yang, Hongshen; Malik, Avinash
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Aprendizaje por Refuerzo en el Comercio de Pares: Un Enfoque de Escalado Dinámico
Categoría
Gestión y administración
Subcategoría
Gestión de recursos
Palabras clave
Criptomoneda
Volatilidad
Comercio
Aprendizaje por refuerzo
Comercio de pares
Ganancias
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
Las criptomonedas son activos digitales basados en criptografía con precios extremadamente volátiles. Alrededor de 70 mil millones de dólares en criptomonedas se negocian diariamente en los intercambios. Negociar criptomonedas es difícil debido a la volatilidad inherente del mercado cripto. Este estudio investiga si el Aprendizaje por Refuerzo (RL) puede mejorar la toma de decisiones en el comercio algorítmico de criptomonedas en comparación con los métodos tradicionales. Para abordar esta cuestión, combinamos el aprendizaje por refuerzo con una técnica de comercio de arbitraje estadístico, el comercio de pares, que explota la diferencia de precios entre activos estadísticamente correlacionados. Construimos entornos de RL y entrenamos agentes de RL para determinar cuándo y cómo comerciar pares de criptomonedas. Desarrollamos nuevas formas de recompensa y espacios de observación/acción para el aprendizaje por refuerzo. Realizamos experimentos con el aprendiz de refuerzo desarrollado en pares de datos BTC-GBP y BTC-EUR separados por intervalos de 1 minuto ( = 263,520). La técnica tradicional de comercio de pares no RL logró un beneficio anualizado del 8.33%, mientras que la técnica de comercio de pares basada en RL propuesta logró beneficios anualizados del 9.94% al 31.53%, dependiendo del aprendiz de RL. Nuestros resultados muestran que el RL puede superar significativamente las técnicas manuales y tradicionales de comercio de pares cuando se aplica a mercados volátiles como las criptomonedas.
Descripción
Las criptomonedas son activos digitales basados en criptografía con precios extremadamente volátiles. Alrededor de 70 mil millones de dólares en criptomonedas se negocian diariamente en los intercambios. Negociar criptomonedas es difícil debido a la volatilidad inherente del mercado cripto. Este estudio investiga si el Aprendizaje por Refuerzo (RL) puede mejorar la toma de decisiones en el comercio algorítmico de criptomonedas en comparación con los métodos tradicionales. Para abordar esta cuestión, combinamos el aprendizaje por refuerzo con una técnica de comercio de arbitraje estadístico, el comercio de pares, que explota la diferencia de precios entre activos estadísticamente correlacionados. Construimos entornos de RL y entrenamos agentes de RL para determinar cuándo y cómo comerciar pares de criptomonedas. Desarrollamos nuevas formas de recompensa y espacios de observación/acción para el aprendizaje por refuerzo. Realizamos experimentos con el aprendiz de refuerzo desarrollado en pares de datos BTC-GBP y BTC-EUR separados por intervalos de 1 minuto ( = 263,520). La técnica tradicional de comercio de pares no RL logró un beneficio anualizado del 8.33%, mientras que la técnica de comercio de pares basada en RL propuesta logró beneficios anualizados del 9.94% al 31.53%, dependiendo del aprendiz de RL. Nuestros resultados muestran que el RL puede superar significativamente las técnicas manuales y tradicionales de comercio de pares cuando se aplica a mercados volátiles como las criptomonedas.