训练工作室
配置并启动 RL 训练任务
数据源
没有可用的数据集
请先在 Data Pipeline 中获取数据,或切换到 "从 Binance 获取" 模式
环境配置
算法
加载中...
网络架构
加载中...
网络参数
e.g. [128, 128] or [256, 128, 64]
奖励函数
加载中...
奖励塑形 (Reward Shaping)
00.30
00.100.5
超参数配置 (Hyperparameters)
80%
80% 用于训练, 20% 用于验证
请先选择一个数据集