Quant_Learner

用最新技术优化深度学习BTC交易机器人

本文翻译自Adam King的《Optimizing deep learning trading bots using state-of-the-art techniques》，英语好的建议读原文，本译本只是学习记录，翻译水平有限，如果专业术语错误还望指正。

教会我们的机器人用特征工程和Bayes优化赚更多的钱。

在上篇文章中，我们创建了不会亏钱的BTC交易机器人。尽管agents是赚钱的，但收益率一般，所以这次更上一层楼，大幅提升模型性能。

再次强调，本系列文章只是为了考察最新深度学习技术是否能够创建正收益BTC交易机器人。关闭任何创建强化学习算法的企图似乎是现状，因为创建一个交易算法是行不通的。然而，相关领域最新进展表明面对相同问题RL程序常常变现优于监督学习。基于此，我写了本系列文章，来考察这些交易程序收益率如何或者考察下现状是否合理。

我们首先优化提升政策网络，平稳输入数据集，这样才能从小数据集中学出更多信息。

然后，我们用前沿特征工程提升agent的观察空间，微调奖励函数产生更优策略。

最后，我们在训练、测试最终程序收益率前，用Bayes优化技术来确定最优超参数。各位看官拿好瓜，尽情欣赏疯狂之旅。

修改

首先改善上文中代码，提升模型盈利水平。代码见我的Github。
RNN递归神经网络

首先调整策略，用递归的LSTM(Long Short-Term Memory)网络替换先前的多层感知机（MLP，MultiLayer Perceptron）。因为RNN能够不受时间影响保持内部结构，我们不再需要哟弄个华东回测窗口捕捉价格波动。相反，采用神经网络的内部递归来捕捉。每个时间步，输入数据以及最新输出数据一同传给算法。

这让LSTM再每个时间步保持内部状态，就像程序能够“记住”或“忘记”特殊的数据关系。

from stable_baselines.common.policies import MlpLstmPolicy
model = PPO2(MlpLstmPolicy, train_env, tensorboard_log="./tensorboard")

平稳数据

上篇文章有人指出我们的时间序列数据是不平稳的。因此任何机器学习模型都很难预测未来价值。

平稳时间序列指均值、方差、自相关系数均为常数。

最主要的是我们的时间序列包含明显的趋势性和季节性，这两点都会影响算法预测准确性。我们可以通过差分和变换技术产生一个更正态分布的时间序列。

差分是将每个时间步减去其导数（收益率）。这样可以去除趋势性，不过依然保留季节性。季节性可以通过再每次差分前先取导数来去除。这样就产生最终的平稳时间序列。下面右图。
```
df['diffed'] = df['Close'] - df['Close'].shift(1)
df['logged_and_diffed'] = np.log(df['Close']) - np.log(df['Close']).shift(1)
```
可以用 Augmented Dickey-Fuller Test测试时间序列的平稳性。测试给出p值为0.00，使我们拒绝测试的空假设，确认时间序列是平稳的。
```
from statsmodels.tsa.stattools import adfuller
df['logged_and_diffed'] = np.log(df['Close']) - np.log(df['Close']).shift(1)
result = adfuller(df['logged_and_diffed'].values[1:], autolag="AIC")
print('p-value: %f' % logged_and_diffed_result[1])
```
这个问题就解决了，下面我们采用特征工程来进一步优化观测空间。
特征工程

为进一步优化模型，我们做一些特征工程。

特征工程是用领域特定只是创造额外输入数据来提升机器学习模型。

本例中，我们会为数据集添加一些常见但有效的技术因子，以及从StatsModels SARIMAX预测模型得到的输出。技术因子会给数据集带来一些尽管滞后却相关的信息。我们的预测模型预测的信息会对其提供很好的支持。此多特征综合会为模型提供一个有用的观测平衡。
技术分析

为选取技术因子集，我们会比较ta库中的32个因子（58个特征）。采用pandas分析同类（动量、成交量、趋势、波动性）因子两两间的相关性，然后只选取每种类型中相关性最低的因子作为特征。此法，我们可以从这些技术因子中获得尽可能多的好处，而不对观测空间增加过多噪音。

结果表明波动性指标都高度相关，几个动量指标也是。当我们删除所有重复特征（在集群中相关性绝对值>0.5）。最终剩38个技术特征加入到观测空间中。完美，我们创建一个add_indicators实用方法将上述特征加到我们的数据集中，并在环境初始化中调用它以免再每个时间步计算这些值。

def __init__(self, df, initial_balance=10000, commission=0.0003, reward_func='profit', **kwargs):
    super(BitcoinTradingEnv, self).__init__()
        
    self.df = df.fillna(method='bfill')
    self.df = add_indicators(self.df.reset_index())
    self.stationary_df = log_and_difference(
        self.df, ['Open', 'High', 'Low', 'Close', 'Volume BTC', 'Volume USD'])

统计分析

下一步是添加预测模型，我们选用Seasonal Auto Regressive Integrated Moving Average (SARIMA)模型提供价格预测，因为其每步计算很快，SARIMA在我们的平稳数据集上准确性好。还有个额外好处，他的实现非常简单，并允许我们为预测结果创建一个置信区间，这通常比一个单值更好。举例说明，agent会学出对置信区间小的预测谨慎信任，当置信区间大时承担更多风险。
```
def _next_observation(self):
  ...
  
  obs = scaled_features[-1]
  
  past_df = self.stationary_df['Close'][:self.current_step + self.n_forecasts + 1]
  forecast_model = SARIMAX(past_df.values)
  model_fit = forecast_model.fit(method='bfgs', disp=False)
  forecast = model_fit.get_forecast(steps=self.n_forecasts, alpha=(1 - self.confidence_interval))

  obs = np.insert(obs, len(obs), forecast.predicted_mean, axis=0)
  obs = np.insert(obs, len(obs), forecast.conf_int().flatten(), axis=0)
```
现在我们已经用一个更合适的递归神经网络更新策略，并用上下文特征工程优化观测空间，是时候做整体优化了。
奖励优化

可能会有人认为上文提到的奖励函数已经是最优选，其实进一步检查就会发现这是不对的。尽管上次的简单奖励函数已经可以盈利，但它经常产出会造成资本损失的不稳定策略。为改善，我们除了未计利润还要考虑其他奖励度量。

上文评论中有人给出了一个简单优化方法：不仅奖励持BTC币待涨，也奖励空仓BTC价跌。例如，我们可以为anget持有BTC/USD仓位时净值增长给与奖励，也可以在其不持有任何仓位时BTC/USD下跌而给出奖励。

虽然这个策略在奖励回报增长方面表现良好，但是并未考虑产生高额收益的风险。投资者长期内会通过简单的收益指标发现这些问题，并习惯上转向经风险调整的回报度量来给与解释。

基于波动率的度量

最常见的风险调整收益度量是夏普率。这是投资组合在一段特殊时期内超额收益对波动率的简单比率。为保持高夏普率，一项投资需同时保持高收益和低波动。对应的数学公式是：
$Sharpe=\frac{R_P-R_B}{\sigma_P}=\frac{Portifolio\; returns - Benchmark \;returns}{Standard\;deviation \; of\;portfolio}$
这个度量久经考验，不过对我们的目的而言略有缺陷，因为它惩罚了上行波动。对于BTC，这很成问题，因为上行波动（价格猛涨）经常是有利可图的。这就把我们引向agents测试的第一项奖励度量。

Sortino率与Sharpe率类似，只是它只把下行波动视为风险，而非全波动。作为结果，Sortino率不惩罚上行波动。数学公式如下：
$Sortino=\frac{R_P-R_B}{\sigma_D}=\frac{Portfolio\;returns-Benchmark\;returns}{Standard\;deviation\;of\;downside}$
额外指标

在此数据集上测试的第二个奖励度量是Calmar率。至此我们所有的度量都没有考虑回撤。

回撤是资产组合一种特殊损失的度量，从高到低

大的回撤对成功的交易策略不利，因为长期的高额收益会被一次突然的大额回撤折损殆尽。

为鼓励策略积极主动组织大额回撤，我们可以用一个奖励指标来解释那些资本损失，比如Calmar率。这个比率与Sharpe率相同，只是用最大回撤代替资产组合值的标准差。
$Calmar=\frac{R_P-R_B}{\mu_D}=\frac{Protfolio\;returns-Benchmark\;returns}{Maximum\;drawdown\;of\;portfolio}$
我们的最后一个指标，也是在对冲基金业普遍应用的，Omega率。理论上，就度量risk vs. return来说，Omega率比Sortino率和Calmar率都好。因为它可以在单个指标中解释收益分布的全部。为计算它，我们需要先计算资产组合基于特定基准上下波动的概率分布，然后取两者比率。比率越高，上升空间高于下降空间的概率就越高。
$Omega=\frac{\int_{R_B}^b1-F(R_P)dx}{\int_a^{R_B}F(R_P)dx}=\frac{Upside\;Potential}{Downside\;Potential}$

代码

虽然编写上述奖励度量听起来挺有趣，不过我还是倾向于用empyrical库来直接计算它们。幸运的是这个库中恰好包含我们上述定义的3个度量。在每个时间步获取比率就像给相关Empyrical函数提供一系列阶段收益和基准收益一样简单。

import numpy as np
from empyrical import sortino_ratio, calmar_ratio, omega_ratio
  
def _reward(self):
      length = min(self.current_step, self.reward_len)
      returns = np.diff(self.net_worths)[-length:]

      if self.reward_func == 'sortino':
          reward = sortino_ratio(returns)
      elif self.reward_func == 'calmar':
          reward = calmar_ratio(returns)
      elif self.reward_func == 'omega':
          reward = omega_ratio(returns)
      else
          reward = np.mean(returns)

      return reward if abs(reward) != inf and not np.isnan(reward) else 0

现在我们已经知道如何去衡量一个成功的交易策略，是时候找出是哪些指标最能衡量优质结果。将上述度量函数逐一放入Optuna并用Bsyes优化方法来找出数据集的最优策略。

工具集

宝刀配英雄。充分利用前辈呕心沥血的工作，不要重复早轮子。对今天的工作，最重要的工具之一就是optuna库，这是一个用 Tree-structured Parzen Estimators (TPEs)实现Bayes优化的库。TPEs可并行，大大减少搜索时长，充分利用GPU。简言之，

Bayes优化是一项高效搜索超空间，寻找最大化目标函数参数集的技术。

简言之，Bayes优化是一种提升任何黑盒模型的高效方法。它的工作方式是通过代理函数或代理函数分布对目标函数建模。分布会随着时间提升，因为算法会探索产生最大值的超空间和区域。

如何将其用于我们的BTC交易机器人？本质上我们可以用此技术找到让模型最优的超参数集。我们正在大海捞针，Bayes优化就是我们的磁铁。让我们开始吧！
部署Optuna

用Optuna优化超参数相当简单。首先，创建一个optuna研究，它是所有超参数探索的母容器。一项试验包含特定的超参数配置和由目标函数造成的成本。然后可调用study.optimize()并传给目标函数，Optuna会采用Bayes优化来找到产生最低成本的超参数配置。

import optuna

def optimize(n_trials = 5000, n_jobs = 4):
    study = optuna.create_study(study_name='optimize_profit', storage='sqlite:///params.db', load_if_exists=True)
    study.optimize(objective_fn, n_trials=n_trials, n_jobs=n_jobs)

此例中，目标函数由在我们的BTC交易环境中训练和测试PPO2模型构成。目标函数返回的成本是测试期的平均奖励，是负数。我们需要取平均奖励的负数，因为Optuna把低回报当为更优尝试。optimize函数为我们的目标函数提供一个实验对象，我们用该对象制定需要优化的变量。

def objective_fn(trial):
    env_params = optimize_envs(trial)
    agent_params = optimize_ppo2(trial)
    
    train_env, validation_env = initialize_envs(**env_params)
    model = PPO2(MlpLstmPolicy, train_env, **agent_params)
    
    model.learn(len(train_env.df))
    
    rewards, done = [], False

    obs = validation_env.reset()
    for i in range(len(validation_env.df)):
        action, _ = model.predict(obs)
        obs, reward, done, _ = validation_env.step(action)
        rewards += reward
    
    return -np.mean(rewards)

optimize_ppo2()和optimize_envs()方法接受一个实验对象并返回一个测试词典。每个变量的搜索空间由对试验调用的特殊suggest函数和传给函数的参数确定。

例如，trial.suggest_loguniform('n_steps', 16, 2048)以对方方式提示一个新的介于16-2048之间的对数(16, 32, 64, …, 1024, 2048)。更进一步，trial.suggest_uniform('cliprange', 0.1, 0.4)会建议一个简单、累计形式的会当属(0.1, 0.2, 0.3, 0.4).此处用不到，不过Optuna也会为建议分类变量提供方法：suggest_categorical('categorical', ['option_one', 'option_two']).

def optimize_ppo2(trial):
    return {
        'n_steps': int(trial.suggest_loguniform('n_steps', 16, 2048)),
        'gamma': trial.suggest_loguniform('gamma', 0.9, 0.9999),
        'learning_rate': trial.suggest_loguniform('learning_rate', 1e-5, 1.),
        'ent_coef': trial.suggest_loguniform('ent_coef', 1e-8, 1e-1),
        'cliprange': trial.suggest_uniform('cliprange', 0.1, 0.4),
        'noptepochs': int(trial.suggest_loguniform('noptepochs', 1, 48)),
        'lam': trial.suggest_uniform('lam', 0.8, 1.)
    }

def optimize_envs(trial):
    return {
        'reward_len': int(trial.suggest_loguniform('reward_len', 1, 200)),
        'forecast_len': int(trial.suggest_loguniform('forecast_len', 1, 200)),
        'confidence_interval': trial.suggest_uniform('confidence_interval', 0.7, 0.99),
    }

稍后，在用一个不错的CPU/GPU组合运行我们的优化函数一夜之后，我们可以用Optuna创建的sqlite数据库中载入研究。该研究从测试中跟踪最佳试验，我们可以用这些测试为环境抓取最佳超参数集。

study = optuna.load_study(study_name='optimize_profit', storage='sqlite:///params.db')
params = study.best_trial.params

env_params = {
    'reward_len': int(params['reward_len']),
    'forecast_len': int(params['forecast_len']),
    'confidence_interval': params['confidence_interval']
}

train_env = DummyVecEnv([lambda: BitcoinTradingEnv(train_df, **env_params)])

model_params = {
    'n_steps': int(params['n_steps']),
    'gamma': params['gamma'],
    'learning_rate': params['learning_rate'],
    'ent_coef': params['ent_coef'],
    'cliprange': params['cliprange'],
    'noptepochs': int(params['noptepochs']),
    'lam': params['lam']
}

model = PPO2(MlpLstmPolicy, train_env, **model_params)

我们已经修改模型、提升特征集、优化所有超参数。现在是时候见证我们的agent如何应对新的奖励机制。我已经训练了一个agent适应前述4中收益度量：简单收益、Sortino率、Calmar率、Omega率。让我们在一个用他们从未训练过的价格数据初始化的测试环境中运行每一个优化后的agent，看看收益率怎么样。

基准

在查看结果之前，我们需要知道一个成功的策略应该是什么样的。基于此，我们将用几个常见但有效的BTC盈利交易策略作为基准。信不信由你，过去十年来最有效的BTC策略之一就是简单的买入然后持有。我们将测试的两外另个策略是用非常简单但有效的技术分析来创建买卖信号。
1. 买入并持币
  
  尽可能多的买入并持币到天荒地老。虽然这个策略不复杂，但是在过去它取得了成功的收益率。
2. RSI
  
  当RSI持续下跌而连续的收盘价持续上涨时，是一个负的反转趋势（卖）信号。当RSI连续上涨而收盘价连续下跌时，一个争相反转信号（买）就出现了。
3. SMA（Simple Moving Average）交叉
  
  当长期移动平均线穿越短期移动平均线，是一个负趋势反转信号（卖）。
  
  当短期移动平均线穿越长期移动平均线，是一个正的趋势反转信号（买）。
  
  测试这些简单基准的目的是证明我们的深度学习agent正在市场上创建alpha。如果我们不能那白那些简单基准，那么我们就是在浪费开发时间浪费GPU，而只是做了一个看起来炫酷的科学项目。让我们它的价值。
结果

我必须提前说明，下面部分的正向收益是错误代码的直接结果。因为数据时间的存储方式防止agent总可以提前12小时看到价格信息，这是明显的前视偏差。问题已经得到修正，但还需要时间替换下面的结果集。请理解这些结果是完全无效且无法复制的。

话虽如此，本文依然有大量研究且本系列文章的目的本就不是为了赚大钱，而是探讨在最新强化学习和优化技术下可以达到什么研究深度。因此为了让本文原汁原味，我还是把旧有（不正确）结果留下了，等后续实践充分我会用新的正确的结果再行更替。

用从CryptoDataDownload下载的小时级数据集（OHCLV）的钱80%训练agent，并用后20%测试观察策略在新数据上的效果。这种简单的交叉验证足以满足需要，因为当我们最终发布算法时，可以在整个数据集上训练并用新输入的数据集作为新的测试集。

让我们快速浏览失败者以便找到成功者。首先我们来看Omega策略，在数据集上相当无用。

看看这个agent，明显这种奖励机制产生了过度交易策略，无法捕捉市场机会。

基于Calmar的策略略优于Omega策略，但最终结果类似。看起来我们投入大量时间和精力只是让事情变得更糟糕。

还记得我们的老朋友简单增量利润么？最然在上文这种奖励机制并未证明很成功，我们所作的修改和优化似乎大幅提升了agent的成功。

在四个月的测试期，平均收益350%。如果你不了解什么是平均市场收益，只要知道是一个疯狂的结果就可以了。当然，这是我们用强化学习的到的最好结果，对吧？

错。Sortino奖励的agent平均收益可达850%。当我看到这些策略的成功，我吓得赶紧检查下有没有错。（温馨提醒：接受下面这句话的讽刺吧）。己经排查，没有bug，此agent在交易BTC上就是这么牛逼。

不是过度交易和资本降低，这些agents似乎能理解低买高卖同时降低持币风险的重要性。不考虑agent具体学出了什么策略，我们的交易机器人明确学会了交易BTC赚钱。如果你不信，自己回测看看。

我不傻，我知道这样成功的回测应该不会再实际交易中发生。话虽如此，但这结果是我迄今见过最好的（这可能也是表明哪里有点不对劲的第一条线索）。想想蛮震惊的，这些程序没有任何金融市场如何工作或者如何做交易的先验知识，仅仅凭着尝试、犯错（也伴随这一些前视偏差）就能获的如此大的成功。当然是大量、大量、大量的尝试和犯错。

结论

本文中，优化了我们的强化学习agents使其在BTC交易中表现的更好，赚更多钱。工作量不小，不过我们根据如下步骤终是完成了：
- 用迭代的，LSTM网络及平稳数据更新现存的模型
- 用特定领域技术和统计分析为agent学习筛选出40+特征
- 提升agent原来的简单收益奖励系统以解释风险
- 用Bayes优化技术微调模型的超参数
- 以基础交易策略为基准，确保机器人总能打败市场
理论上，一个高收益的机器人是伟大的。然而，我收到了不少反馈说这些agents知识简单的学习拟合曲线，并不会在实盘中真正盈利。我们关于数据集切分成训练集/测试集的方式应该可以解释这个问题，的确我们的模型可能在这个数据集上过度拟合，不能在新数据集上表象良好。话虽如此，我的第六感告诉我，这些agent并非仅仅在拟合曲线，因此会在实盘中获利的。

为了实验这个假设，下篇文章会专注于将这些RLagents部署到真实环境。我们首先会更新环境以支持更多加密货币对如ETH/USD和LTC/USD。然后将其部署到Coinbase Pro交易所实盘交易。不管最终是否赚钱，这都是件令人兴奋的事儿，你一并不想错过。

顺便一提，要想改进agent表现还有很多工作要做，但我时间有限，而且已经为其投入甚多，如果你有兴趣可以在我工作的基础上继续改进，如果结果比我做的还好，可以底下留言，我们共同探讨。

再次声明，本系列文章用于教育，不作为实盘交易建议。你不应该基于本文的任何策略实盘交易，除非你想拿自己的真金白银打水漂。

感谢阅读，一如既往，本文所有代码都在以在我的Github上看到。如有问题及反馈，欢迎地下留言，期待你的声音。

你可能感兴趣的:(小白学量化交易,强化学习,强化学习与量化交易)

大数据点燃智能制造变革之火——从数据到价值的跃迁 Echo_Wish 大数据高阶实战秘籍大数据制造
大数据点燃智能制造变革之火——从数据到价值的跃迁在全球制造业向智能化转型的浪潮中，大数据已然成为点燃变革的关键火种。从车间到供应链，从设备到产品生命周期，制造业正通过大数据分析找到隐形的效率优化机会，打破传统生产模式的桎梏。作为Echo_Wish，今天我将和大家探讨大数据如何融入智能制造，助力实现生产效率和业务价值的双重飞跃。一、智能制造的核心诉求：数据驱动的决策与执行智能制造的目标是通过数据驱动
时钟控制模块、主频修改实验 Couvrir洪荒猛兽 #野火i.mx 6ull裸机开发单片机 stm32 嵌入式硬件
目录一、时钟控制模块1.1核心1.2系统时钟来源1.3PLU和PFD倍频时钟1.4PLL选择时钟1.5外设时钟二、主频修改实验2.1clock.c/h文件2.2main.c文件2.3Makefile文件2.4实验现象一、时钟控制模块1.1核心4个层次配置芯片时钟：配置晶振时钟（24MHz）配置PLL与PFD时钟（528PLL、USB1PLL细分PFD）配置PLL选择时钟配置根时钟/外设时钟1.2系
【ol-cesium】OpenLayers与Cesium的二三维联动不爱赖床的懒虫笔记前端 vue cesium openlayers 二三维联动
OpenLayers与Cesium的二三维联动本文主要介绍OpenLayers与Cesium二三维联动的实现过程，以及在实现的过程中所遇到的问题以及解决方法。研究二三维联动的动机是需要开发基于GeoServer地图服务器的地理场景可视化系统，其中涉及到对服务器中地理数据的展示与交互部分，同时在三维场景中展示数字高程与地表影像信息。地理场景可视化系统我后续也会站看介绍，感兴趣的读者可以关注我后续的博
基于ASP.NET Core的JsonApiDotNetCore框架详解与实践 MCPlayer542
本文还有配套的精品资源，点击获取简介：JsonApiDotNetCore是一个用于.NETCoreASP.NETCore应用程序的JSONAPI框架，它简化了JSONAPI的构建过程，特别是排序、过滤和分页等常见功能。这个框架支持JSONAPI规范，旨在减少开发者编写重复样板代码的工作量，利用.NETCore的依赖注入特性提供高度的可扩展性。开发者可以通过自定义服务和组件来扩展业务逻辑，并实现版本
FPGA基带平台射频数据处理装置及验证系统设计与方法 BE东欲
本文还有配套的精品资源，点击获取简介：FPGA在射频数据处理领域拥有灵活性和高性能，广泛用于通信、雷达、卫星导航等。本资料包重点介绍FPGA基带平台在数字信号处理中的应用，包括调制解调、滤波和FFT等任务。涵盖射频数据处理装置结构，验证系统设计和实施，以及相关工具的使用方法。为学习者提供实践经验和理论知识，助力开发高效可靠的通信系统。1.FPGA在射频数据处理中的应用数字信号处理（DSP）是现代电
PyTorch深度学习框架60天进阶学习计划 - 第28天：多模态模型实践（一）凡人的AI工具箱深度学习 pytorch 学习 AI编程人工智能 python
PyTorch深度学习框架60天进阶学习计划-第28天：多模态模型实践（一）引言：跨越感知的边界欢迎来到我们的PyTorch学习旅程第28天！今天我们将步入AI世界中最激动人心的领域之一：多模态学习。想象一下，如果你的模型既能"看"又能"读"，并且能够理解图像与文字之间的联系，这将为我们打开怎样的可能性？今天我们将专注于构建图文匹配系统，学习如何使用CLIP（ContrastiveLanguage
【AI 天才研究院】从 MoE 架构到 AGI：DeepSeek 将给未来带来哪些影响？ AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型人工智能架构 agi DeepSeek
关键技术创新DeepSeek的成本优势主要源于以下几个方面的技术创新：混合专家（MoE）架构：通过选择性激活特定专家网络，大幅降低了计算成本。具体而言，DeepSeekMoE架构实现了：仅用大约40%的计算量，便达到了与LLaMA2-7B差不多的效果。这种选择性激活的方式大大提高了模型的参数效率，从而在保持高性能的同时，也能在计算资源的使用上保持高效。FP8低精度训练：DeepSeek采用了FP8
FPGA设计中衍生时钟的定义及约束学习永无止境@ FPGA设计 fpga开发 fpga 时钟约束
衍生时钟的定义：衍生时钟主要是指由已有的主时钟进行分频、倍频或相移而产生出来的时钟信号，如由时钟管理单元（MMCM等）或一些设计逻辑所驱动产生的时钟信号。衍生时钟的定义取决于主时钟的特性，衍生时钟约束必须指定时钟源，这个时钟源可以是一个已经约束好的主时钟或者另一个衍生时钟，衍生时钟并不直接定义频率、占空比等参数，而是定义其与时钟源的相对关系，如分频系数、倍频系数、相移差值、占空比差值等。因此，在做
UI自动化测试往往在功能测试之后进行的核心原因豌豆射手^ 测试 ui 功能测试
一、流程效率：避免“过早优化浪费资源”1.功能未定型，频繁修改导致脚本维护成本高实际场景：某电商平台开发初期，前端页面按钮的ID因需求变动频繁更改。此时若投入UI自动化，需不断调整元素定位逻辑，甚至完全重写脚本。对比分析：阶段功能测试方式成本对比开发初期手动功能测试人工快速验证，适应变化，成本低。稳定期UI自动化测试代码维护成本高，反复修改会抵消效率收益。2.瀑布模型与敏捷开发的差异瀑布模型：严格
后端框架模块化 GIS程序媛—椰子后端
后端框架的模块化设计旨在简化开发流程、提高可维护性，并通过分层解耦降低复杂性。以下是常见的后端模块及其在不同语言（Node.js、Java、Python）中的实现方式：目录1.路由（Routing）2.中间件（Middleware）3.数据库与ORM（models）4.迁移（Migration）5.服务层（ServiceLayer）6.配置管理（Configuration）7.依赖注入（DI）8.
Zynq PL端IP核之AXI DMA Mazy.v fpga开发嵌入式硬件 arm开发单片机
1.AXIDMA简介Zynq提供了两种DMA，一种是PS中的DMA控制器，通过GP口与PL端连接，另一种是PL中的AXIDMAIP核（软核），通过HP口与PS端连接。Zynq有4个HP接口，每一个HP接口都包含控制和数据FIFO，这些FIFO为大数据量突发传输提供缓冲，让HP接口成为理想的高速数据传输接口。AXIDMAIP内核在AXI4内存映射和AXI4StreamIP接口之间提供高带宽直接储存访
神州数码基础命令小淮@ 网络运维数据库
组网小知识1.设备连接：不同种类型设备的连接用：直通线同种或是跨层设备的连接用：交叉线（路由与PC）2.注意设备的叠放次序3.IP地址要先理顺，以便加快速度。先完成基本配置，全网连通后，继续其它。交换机还原配置文件：特权模式下：setdefault/write/后重启reload被加入密码后，起动过程，ctrl+b/deletestartup-config/后重启reload操作系统nos.img
用Python修改Word文档字体
在数字化办公场景中，Word文档作为主流文件格式承载着大量商务文书与学术资料。传统手动调整字体格式的操作模式存在显著局限性：当面对批量文档处理、动态内容生成或企业级模板维护时，逐一手工修改不仅效率低下，更难以保障格式规范的统一性。通过Python实现文档字体的程序化控制，能够有效构建自动化处理流程，在确保排版精准度的同时，显著提升文档批量化操作能力。本文将介绍如何使用Python修改Word文档段
HarmonyOS 5 开发环境介绍 harmonyos-next
一、HarmonyOS5是什么？HarmonyOS5是华为推出的新一代分布式操作系统，基于微内核架构，专注于鸿蒙原生应用开发，不再兼容安卓APK。其核心目标是通过"一次开发、多端部署"的能力，实现全场景设备（手机、平板、智能穿戴、车机、智能家居等）的无缝协同。核心特性包括：分布式架构：设备间可自由组网，共享算力与资源；高性能内核：基于开源鸿蒙（OpenHarmony）优化，支持64位ARM、x86
2025年ITIL 4与六西格玛结合：如何提升服务质量与持续改进 - ITIL认证 itil
在追求卓越运营和持续改进的过程中，ITIL4和六西格玛（SixSigma）是两大关键框架，它们在帮助企业提升服务质量和效率方面发挥着至关重要的作用。随着2025年企业对质量和持续改进的重视日益增加，理解ITIL4与六西格玛之间的关系，将为组织在服务管理和质量控制上提供有力的支持。通过将这两个框架结合使用，企业不仅可以在服务交付中确保更高的质量，还能通过精益方法推动不断的流程改进。首先，ITIL4与
软件研发如何量化管理考核KPI指标软件工程
明确关键业务目标、量化数据指标、过程管控与反馈、重视协同与激励是软件研发中量化管理考核KPI的主要切入点。其中，过程管控与反馈尤为关键，因为它能帮助团队及时发现进度和质量问题，并快速响应调整策略，让每个阶段的目标与执行更趋于一致。通过持续监控研发过程中各项数据指标，并对出现的偏差进行即时纠偏，可以让团队在激烈的竞争环境中始终保持高效迭代和持续创新的能力，为业务拓展提供源源不断的动力。一、软件研发量
6.Redis 缓存使用问题及解决方案拾柒mm 缓存 redis mybatis
引言Redis作为一种高效的缓存解决方案，广泛应用于各类项目中。然而，使用缓存时也会面临一些问题，特别是数据一致性、缓存穿透、击穿、雪崩等问题。1.数据一致性数据一致性是指在使用缓存时，缓存中的数据与数据库中的数据保持一致。数据不一致可能导致用户获取到过时的信息，影响用户体验。1.1数据操作方案在进行数据增删改操作时，常见的方案有：先更新缓存，再更新数据库：优点：缓存命中率提高，用户可以快速获取到
深入了解 C# 中的 LINQ：功能、语法与应用解析江沉晚呤时 Net core C#solr lucene c#.netcore
1.什么是LINQ？LINQ（LanguageIntegratedQuery，语言集成查询）是C#和其他.NET语言中的一种强大的查询功能，它允许开发者在语言中直接执行查询操作。LINQ使得开发者可以使用C#语法（或VB.NET）直接对集合、数据库、XML等数据源进行查询和操作，而不需要依赖外部查询语言（如SQL）或者复杂的API。LINQ提供了一个统一的查询模型，可以对各种数据源进行查询，包括集
2025年ITIL 4与敏捷开发的结合：提升IT服务交付的灵活性与响应速度 — ITIL证书 itil
随着敏捷开发和持续交付的兴起，企业对IT服务的交付方式要求越来越高。传统的IT服务管理框架往往难以满足快速变化的业务需求和技术环境，而ITIL4的灵活性和可扩展性使其能够与敏捷开发方法有效结合，从而提升IT服务交付的灵活性、响应速度和质量。本文将探讨ITIL4与敏捷开发方法结合的优势，并介绍如何通过这种结合优化服务交付流程、提高团队协作效率、推动持续改进。ITIL4与敏捷开发的关系敏捷开发强调迭代
“大国品牌”建设全面启动，工业电商生态加速成型人工智能
3月17日，AMT企源与中国工业互联网研究院（简称“工联院”）于北京、上海两地同步举行“大国品牌”电商平台项目启动仪式。工联院相关领导和负责人，AMT企源团队负责人、项目经理和项目骨干，共同出席本次启动仪式。工联院成立于2018年，是工业和信息化部直属的科研机构，承担工业互联网相关的发展战略、规划、政策、标准研究，网络、平台、安全体系建设，国际交流与合作等工作。为落实品牌强国战略，加速优质品牌的培
YashanDB恢复数据库
本文内容来自YashanDB官网，原文内容请见https://doc.yashandb.com/yashandb/23.3/zh/%E6%95%B0%E6%8D%AE%...操作说明使用本方式执行恢复时，要求当前数据库实例处于NOMOUNT状态。执行恢复操作的数据库版本需与生成备份集的数据库版本完全一致。共享集群部署中，只能在主集群上执行恢复操作（即其角色必须为MASTER\_ROLE，可查询视图
GitHub霸榜神器！NextChat领衔DeepSeek全栈开发范式大禹智库《向量数据库指南》《实战AI智能体》机器学习 RAG AI智能体人工智能 Manus deepseek NextChat
一、项目概况与生态定位NextChat（原ChatGPT-Next-Web）是GitHub上斩获81.2K星标的现象级开源项目，定位为"轻量级AI助手终端"，支持DeepSeek、Claude、GPT-4、Gemini等20+主流大模型。其核心价值在于以5MB超小客户端实现跨平台（Windows/Mac/Linux/iOS/Android）无缝衔接，同时提供云端一键部署方案，成为个人用户与企业私有
js知识点-拓展运算符和剩余运算符 lmryBC49 javascript 开发语言 ecmascript
概述在现代JavaScript开发中，ES6引入的拓展运算符（SpreadOperator）和剩余运算符（RestOperator）让代码更加简洁和灵活。无论是数组、对象的拆分与合并，还是函数参数的处理，这两个运算符都是非常实用的工具。拓展运算符1.什么是拓展运算符？拓展运算符（SpreadOperator）由三个连续的点...表示，用于将一个可迭代对象（例如数组、字符串等）展开成多个元素。拓展运
SSRF 攻击与防御：从原理到落地实践花千树-010 架构设计网络安全运维容器网络安全 docker
1.什么是SSRF？SSRF（Server-SideRequestForgery）是一种常见的Web安全漏洞。当服务器提供了某种对外请求的功能，如“URL参数直接转发请求”，攻击者就可以通过精心构造的URL，让服务器“自己”去访问特定的地址，从而达到以下目的：扫描内网：探测企业内网中未暴露在公网的资产，如数据库、私有API等。获取云元数据：例如访问http://169.254.169.254/la
Docker 镜像优化：如何避免重复安装软件，加速服务的构建与部署花千树-010 Docker docker 容器运维
在日常开发中，我们经常遇到这样的问题：由于服务需要额外安装大量软件（如JDK、vim、curl、git等），导致Docker镜像构建时间过长，并且每次构建都需要重复安装这些依赖。今天，我们将探讨几种优化方案，通过构建中间层镜像和使用多阶段构建，从而显著提高构建和部署效率。问题分析当你在Dockerfile中直接使用aptinstall安装依赖时，通常会面临以下问题：重复安装导致构建缓慢每次构建镜像
nextjs 实现rag知识库检索增强的ai问答app *goliter * web开发学习人工智能
AI-Chat-一个基于LLM大语言模型的知识库问答系统项目源码：https://github.com/goliter/ai-chat项目简介AI-Chat是一个基于Next.js和React开发的现代化大语言模型的知识库问答系统。该平台提供了简易的对话界面，支持上传文件进行知识库的构建，让用户在与大语言模型进行问答时给与大模型知识库内的相关内容。主要功能上传文件构建属于自己的知识库支持doc,t
360度用户信息赋能老客运营自动化刘小奇�多自动化运维 sass
在当今竞争激烈的商业环境中，客户关系管理（CRM）系统已成为企业提升客户满意度和忠诚度的重要工具。通过基于360度用户信息，企业能够深入洞察老客需求，实现自动化的老客运营和维护，从而提升客户体验和企业竞争力。一、360度用户信息整合：洞察老客需求的关键（一）多渠道数据收集企业需要从多个渠道收集客户数据，包括线上线下的交互记录。例如，通过企业微信，销售人员可以实时与客户沟通，了解他们的最新需求和反馈
域名如何绑定服务我真的不想做程序员 java java 后端开发语言服务器阿里云容器
目录一、理解域名与Java服务之间的关系二、DNS解析三、配置DNS记录四、Java服务的配置1.部署Java应用2.配置反向代理五、DNS解析六、验证绑定是否成功七、代码示例八、总结在现代网络应用中，域名和Java服务的绑定是实现用户友好访问和后台服务的关键步骤。本文将详细介绍这一过程，包括DNS解析、反向代理以及Java服务的配置，最后会展示代码示例和视觉化流程图。一、理解域名与Java服务之
Profinet转ModbusTCP网关模块连发那科机器人与DCS通讯 BA_TU_AUTO_TECH Profinet转Modbus TCP网关 Modbus TCP转Profinet网关服务器网络
一、现场要求：发那科机器人作为服务器端，DCS作为客户端向发那科机器人发送读写请求，发那科机器人应答后DCS接收发那科机器人的数据，实现数据的传递。二、解决方案：在不增加编程任务的前提下只需在DCS与机器人中间添加巴图自动化Profinet转ModbusTCP网关（BT-ETHPN20）就可实现。本文将介绍如何使用巴图自动化Profinet转ModbusTCP网关（BT-ETHPN20）配置通讯三
动态规划算法求解背包问题的全面剖析 15号外媒算法
摘要本文深入剖析动态规划算法在求解背包问题中的应用，详细阐述动态规划算法的基本原理、核心要素与解题步骤。通过对0-1背包问题和完全背包问题的具体分析，展示动态规划算法在解决背包问题上的高效性与独特优势。同时，结合实际案例进行算法实现与结果分析，并探讨算法的优化策略与拓展应用，旨在帮助读者全面掌握动态规划算法求解背包问题的方法与技巧。一、引言背包问题作为组合优化领域的经典问题，在资源分配、投资决策、
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include

用最新技术优化深度学习BTC交易机器人

修改

RNN递归神经网络

平稳数据

特征工程

技术分析

统计分析

奖励优化

基于波动率的度量

额外指标

代码

工具集

部署Optuna

基准

买入并持币

RSI

SMA（Simple Moving Average）交叉

结果

结论

你可能感兴趣的:(小白学量化交易,强化学习,强化学习与量化交易)

部署`Optuna`