La estrategia consiste en una forma de Deep Q-Learning (DQN), que es una técnica de aprendizaje por refuerzo utilizada para tomar decisiones basadas en la interacción con un entorno. En este caso, el entorno son los retornos de dos criptoactivos, y las decisiones son si tomar una posición larga (comprar) o corta (vender) en estos activos.

Pasos Básicos de la Estrategia:

  1. Inicialización:

    • Se crea una red neuronal principal para predecir los valores Q (Q-values), que indican la calidad de las acciones en un estado dado.

    • Se crea una red neuronal objetivo que se actualiza periódicamente para estabilizar el aprendizaje.

  2. Exploración vs. Explotación:

    • Al principio, se eligen acciones al azar para explorar el entorno.

    • A medida que pasa el tiempo, se eligen más acciones basadas en la red neuronal para explotar el conocimiento adquirido.

  3. Interacción con el Entorno:

    • El agente (tu modelo) toma una acción en el entorno y recibe una recompensa basada en la acción tomada y el nuevo estado alcanzado.

    • Esta información (estado, acción, recompensa, nuevo estado) se almacena en una memoria de experiencia.

  4. Entrenamiento:

    • Regularmente, se toman muestras aleatorias de la memoria de experiencia y se usan para entrenar la red neuronal principal.

    • La red neuronal objetivo se actualiza periódicamente para reflejar los pesos de la red principal.

  5. Actualización de la Política:

    • La política del agente (la estrategia de trading) se ajusta constantemente basándose en el aprendizaje de la red neuronal.

Quieres saber como implementar esta y otras estrategias de trading en tu operativa, sigueme para mas contenido

$BTC $ETH $BNB