Python实现股票回测框架搭建,回测交易策略可行性。

文章目录

  • 什么是回测框架?
  • 回测框架
  • 交易历史数据
  • 回测报告
  • 回测示例
      • 关于Python技术储备
        • 一、Python所有方向的学习路线
        • 二、Python基础学习视频
        • 三、精品Python学习书籍
        • 四、Python工具包+项目源码合集
        • ①Python工具包
        • ②Python实战案例
        • ③Python小游戏源码
        • 五、面试资料
        • 六、Python兼职渠道


Python实现股票回测框架搭建,回测交易策略可行性。_第1张图片

什么是回测框架?

无论是传统股票交易还是量化交易,无法避免的一个问题是我们需要检验自己的交易策略是否可行,而最简单的方式就是利用历史数据检验交易策略,而回测框架就是提供这样的一个平台让交易策略在历史数据中不断交易,最终生成最终结果,通过查看结果的策略收益,年化收益,最大回测等用以评估交易策略的可行性。

代码地址在最后。

本项目并不是一个已完善的项目, 还在不断的完善。

回测框架

回测框架应该至少包含两个部分, 回测类, 交易类.

回测类提供各种钩子函数,用于放置自己的交易逻辑,交易类用于模拟市场的交易平台,这个类提供买入,卖出的方法。

代码架构

以自己的回测框架为例。主要包含下面两个文件

backtest/
backtest.py
broker.py

backtest.py主要提供BackTest这个类用于提供回测框架,暴露以下钩子函数.

def initialize(self):
  """在回测开始前的初始化"""
  pass
 def before\_on\_tick(self, tick):
  pass
 def after\_on\_tick(self, tick):
  pass
 def before\_trade(self, order):
  """在交易之前会调用此函数
  可以在此放置资金管理及风险管理的代码
  如果返回True就允许交易,否则放弃交易
  """
  return True
 def on\_order\_ok(self, order):
  """当订单执行成功后调用"""
  pass
 def on\_order\_timeout(self, order):
  """当订单超时后调用"""
  pass
 def finish(self):
  """在回测结束后调用"""
  pass
 @abstractmethod
 def on\_tick(self, bar):
  """
  回测实例必须实现的方法,并编写自己的交易逻辑
  """
  pass

玩过量化平台的回测框架或者开源框架应该对这些钩子函数不陌生,只是名字不一样而已,大多数功能是一致的,除了on_tick.

之所以是on_tick而不是on_bar, 是因为我希望交易逻辑是一个一个时间点的参与交易,在这个时间点我可以获取所有当前时间的所有股票以及之前的股票数据,用于判断是否交易,而不是一个时间点的一个一个股票参与交易逻辑。

而broker.py主要提供buy,sell两个方法用于交易。

def buy(self, code, price, shares, ttl=-1):
  """
  限价提交买入订单
  ---------
  Parameters:
   code:str
    股票代码
   price:float or None
    最高可买入的价格, 如果为None则按市价买入
   shares:int
    买入股票数量
   ttl:int
    订单允许存在的最大时间,默认为-1,永不超时
  ---------
  return:
   dict
    {
    "type": 订单类型, "buy",
    "code": 股票代码,
    "date": 提交日期,
    "ttl": 存活时间, 当ttl等于0时则超时,往后不会在执行
    "shares": 目标股份数量,
    "price": 目标价格,
    "deal\_lst": 交易成功的历史数据,如
     \[{"price": 成交价格,
      "date": 成交时间,
      "commission": 交易手续费,
      "shares": 成交份额
     }\]
    ""
   }
  """
  if price is None:
   stock\_info = self.ctx.tick\_data\[code\]
   price = stock\_info\[self.deal\_price\]
  order = {
   "type": "buy",
   "code": code,
   "date": self.ctx.now,
   "ttl": ttl,
   "shares": shares,
   "price": price,
   "deal\_lst": \[\]
  }
  self.submit(order)
  return order
 def sell(self, code, price, shares, ttl=-1):
  """
  限价提交卖出订单
  ---------
  Parameters:
   code:str
    股票代码
   price:float or None
    最低可卖出的价格, 如果为None则按市价卖出
   shares:int
    卖出股票数量
   ttl:int
    订单允许存在的最大时间,默认为-1,永不超时
  ---------
  return:
   dict
    {
    "type": 订单类型, "sell",
    "code": 股票代码,
    "date": 提交日期,
    "ttl": 存活时间, 当ttl等于0时则超时,往后不会在执行
    "shares": 目标股份数量,
    "price": 目标价格,
    "deal\_lst": 交易成功的历史数据,如
     \[{"open\_price": 开仓价格,
      "close\_price": 成交价格,
      "close\_date": 成交时间,
      "open\_date": 持仓时间,
      "commission": 交易手续费,
      "shares": 成交份额,
      "profit": 交易收益}\]
    ""
   }
  """
  if code not in self.position:
   return
  if price is None:
   stock\_info = self.ctx.tick\_data\[code\]
   price = stock\_info\[self.deal\_price\]
  order = {
   "type": "sell",
   "code": code,
   "date": self.ctx.now,
   "ttl": ttl,
   "shares": shares,
   "price": price,
   "deal\_lst": \[\]
  }
  self.submit(order)
  return order

由于我很讨厌抽象出太多类,抽象出太多类及方法,我怕我自己都忘记了,所以对于对象的选择都是尽可能的使用常用的数据结构,如list, dict.

这里用一个dict代表一个订单。

上面的这些方法保证了一个回测框架的基本交易逻辑,而回测的运行还需要一个调度器不断的驱动这些方法,这里的调度器如下。

class Scheduler(object):
 """
整个回测过程中的调度中心, 通过一个个时间刻度(tick)来驱动回测逻辑

所有被调度的对象都会绑定一个叫做ctx的Context对象,由于共享整个回测过程中的所有关键数据,  
可用变量包括:  
    ctx.feed: {code1: pd.DataFrame, code2: pd.DataFrame}对象  
    ctx.now: 循环所处时间  
    ctx.tick\_data: 循环所处时间的所有有报价的股票报价  
    ctx.trade\_cal: 交易日历  
    ctx.broker: Broker对象  
    ctx.bt/ctx.backtest: Backtest对象
可用方法:    
 ctx.get\_hist
 """
 def \_\_init\_\_(self):
  """"""
  self.ctx = Context()
  self.\_pre\_hook\_lst = \[\]
  self.\_post\_hook\_lst = \[\]
  self.\_runner\_lst = \[\]
 def run(self):
  # runner指存在可调用的initialize, finish, run(tick)的对象
  runner\_lst = list(chain(self.\_pre\_hook\_lst, self.\_runner\_lst, self.\_post\_hook\_lst))
  # 循环开始前为broker, backtest, hook等实例绑定ctx对象及调用其initialize方法
  for runner in runner\_lst:
   runner.ctx = self.ctx
   runner.initialize()
  # 创建交易日历
  if "trade\_cal" not in self.ctx:
   df = list(self.ctx.feed.values())\[0\]
   self.ctx\["trade\_cal"\] = df.index
  # 通过遍历交易日历的时间依次调用runner
  # 首先调用所有pre-hook的run方法
  # 然后调用broker,backtest的run方法
  # 最后调用post-hook的run方法
  for tick in self.ctx.trade\_cal:
   self.ctx.set\_currnet\_time(tick)
   for runner in runner\_lst:
    runner.run(tick)
  # 循环结束后调用所有runner对象的finish方法
  for runner in runner\_lst:
   runner.finish()

在Backtest类实例化的时候就会自动创建一个调度器对象,然后通过Backtest实例的start方法就能启动调度器,而调度器会根据历史数据的一个一个时间戳不断驱动Backtest, Broker实例被调用。

为了处理不同实例之间的数据访问隔离,所以通过一个将一个Context对象绑定到Backtest, Broker实例上,通过self.ctx访问共享的数据,共享的数据主要包括feed对象,即历史数据,一个数据结构如下的字典对象。

{code1: pd.DataFrame, code2: pd.DataFrame}

而这个Context对象也绑定了Broker, Backtest的实例, 这就可以使得数据访问接口统一,但是可能导致数据访问混乱,这就要看策略者的使用了,这样的一个好处就是减少了一堆代理方法,通过添加方法去访问其他的对象的方法,真不嫌麻烦,那些人。

绑定及Context对象代码如下:

class Context(UserDict):
 def \_\_getattr\_\_(self, key):
  # 让调用这可以通过索引或者属性引用皆可
  return self\[key\]
 def set\_currnet\_time(self, tick):
  self\["now"\] = tick
  tick\_data = {}
  # 获取当前所有有报价的股票报价
  for code, hist in self\["feed"\].items():
   df = hist\[hist.index == tick\]
   if len(df) == 1:
    tick\_data\[code\] = df.iloc\[-1\]
  self\["tick\_data"\] = tick\_data
 def get\_hist(self, code=None):
  """如果不指定code, 获取截至到当前时间的所有股票的历史数据"""
  if code is None:
   hist = {}
   for code, hist in self\["feed"\].items():
    hist\[code\] = hist\[hist.index <= self.now\]
  elif code in self.feed:
   return {code: self.feed\[code\]}
  return hist
class Scheduler(object):
 """
整个回测过程中的调度中心, 通过一个个时间刻度(tick)来驱动回测逻辑

所有被调度的对象都会绑定一个叫做ctx的Context对象,由于共享整个回测过程中的所有关键数据,  

可用变量包括:  
  ctx.feed: {code1: pd.DataFrame, code2: pd.DataFrame}对象
  ctx.now: 循环所处时间
  ctx.tick\_data: 循环所处时间的所有有报价的股票报价
  ctx.trade\_cal: 交易日历
  ctx.broker: Broker对象
  ctx.bt/ctx.backtest: Backtest对象
可用方法:  
  ctx.get\_hist
 """
 def \_\_init\_\_(self):
  """"""
  self.ctx = Context()
  self.\_pre\_hook\_lst = \[\]
  self.\_post\_hook\_lst = \[\]
  self.\_runner\_lst = \[\]
 def add\_feed(self, feed):
  self.ctx\["feed"\] = feed
 def add\_hook(self, hook, typ="post"):
  if typ == "post" and hook not in self.\_post\_hook\_lst:
   self.\_post\_hook\_lst.append(hook)
  elif typ == "pre" and hook not in self.\_pre\_hook\_lst:
   self.\_pre\_hook\_lst.append(hook)
 def add\_broker(self, broker):
  self.ctx\["broker"\] = broker
 def add\_backtest(self, backtest):
  self.ctx\["backtest"\] = backtest
  # 简写
  self.ctx\["bt"\] = backtest
 def add\_runner(self, runner):
  if runner in self.\_runner\_lst:
   return
  self.\_runner\_lst.append(runner)

为了使得整个框架可扩展,回测框架中框架中抽象了一个Hook类,这个类可以在在每次回测框架调用前或者调用后被调用,这样就可以加入一些处理逻辑,比如统计资产变化等。

这里创建了一个Stat的Hook对象,用于统计资产变化。

class Stat(Base):
  def \_\_init\_\_(self):
    self.\_date\_hist = \[\]
    self.\_cash\_hist = \[\]
    self.\_stk\_val\_hist = \[\]
    self.\_ast\_val\_hist = \[\]
    self.\_returns\_hist = \[\]

  def run(self, tick):
    self.\_date\_hist.append(tick)
    self.\_cash\_hist.append(self.ctx.broker.cash)
    self.\_stk\_val\_hist.append(self.ctx.broker.stock\_value)
    self.\_ast\_val\_hist.append(self.ctx.broker.assets\_value)

  @property
  def data(self):
    df = pd.DataFrame({"cash": self.\_cash\_hist,
              "stock\_value": self.\_stk\_val\_hist,
              "assets\_value": self.\_ast\_val\_hist}, index=self.\_date\_hist)
    df.index.name = "date"
    return df

而通过这些统计的数据就可以计算最大回撤年化率等。

def get\_dropdown(self):
    high\_val = -1
    low\_val = None
    high\_index = 0
    low\_index = 0
    dropdown\_lst = \[\]
    dropdown\_index\_lst = \[\]
    for idx, val in enumerate(self.\_ast\_val\_hist):
      if val >= high\_val:
        if high\_val == low\_val or high\_index >= low\_index:
          high\_val = low\_val = val
          high\_index = low\_index = idx
          continue
        dropdown = (high\_val - low\_val) / high\_val
        dropdown\_lst.append(dropdown)
        dropdown\_index\_lst.append((high\_index, low\_index))
        high\_val = low\_val = val
        high\_index = low\_index = idx
      if low\_val is None:
        low\_val = val
        low\_index = idx
      if val < low\_val:
        low\_val = val
        low\_index = idx
    if low\_index > high\_index:
      dropdown = (high\_val - low\_val) / high\_val
      dropdown\_lst.append(dropdown)
      dropdown\_index\_lst.append((high\_index, low\_index))
    return dropdown\_lst, dropdown\_index\_lst
  @property
  def max\_dropdown(self):
    """最大回车率"""
    dropdown\_lst, dropdown\_index\_lst = self.get\_dropdown()
    if len(dropdown\_lst) > 0:
      return max(dropdown\_lst)
    else:
      return 0
  @property
  def annual\_return(self):
    """
    年化收益率
    y = (v/c)^(D/T) - 1
    v: 最终价值
    c: 初始价值
    D: 有效投资时间(365)
    注: 虽然投资股票只有250天,但是持有股票后的非交易日也没办法投资到其他地方,所以这里我取365

    参考: [https://wiki.mbalib.com/zh-tw/%E5%B9%B4%E5%8C%96%E6%94%B6%E7%9B%8A%E7%8E%87](https://wiki.mbalib.com/zh-tw/%E5%B9%B4%E5%8C%96%E6%94%B6%E7%9B%8A%E7%8E%87)  
    """
    D = 365
    c = self.\_ast\_val\_hist\[0\]
    v = self.\_ast\_val\_hist\[-1\]
    days = (self.\_date\_hist\[-1\] - self.\_date\_hist\[0\]).days
    ret = (v / c) \*\* (D / days) - 1
    return ret

至此一个笔者需要的回测框架形成了。

交易历史数据

在回测框架中我并没有集成各种获取数据的方法,因为这并不是回测框架必须集成的部分,规定数据结构就可以了,数据的获取通过查看数据篇,

回测报告

回测报告我也放在了回测框架之外,这里写了一个Plottter的对象用于绘制一些回测指标等。结果如下:

Python实现股票回测框架搭建,回测交易策略可行性。_第2张图片

回测示例

下面是一个回测示例。

import json
from backtest import BackTest
from reporter import Plotter
class MyBackTest(BackTest):
  def initialize(self):
    self.info("initialize")
  def finish(self):
    self.info("finish")
  def on\_tick(self, tick):
    tick\_data = self.ctx\["tick\_data"\]
    for code, hist in tick\_data.items():
      if hist\["ma10"\] > 1.05 \* hist\["ma20"\]:
        self.ctx.broker.buy(code, hist.close, 500, ttl=5)
      if hist\["ma10"\] < hist\["ma20"\] and code in self.ctx.broker.position:
        self.ctx.broker.sell(code, hist.close, 200, ttl=1)
if \_\_name\_\_ == '\_\_main\_\_':
  from utils import load\_hist
  feed = {}
  for code, hist in load\_hist("000002.SZ"):
    # hist = hist.iloc\[:100\]
    hist\["ma10"\] = hist.close.rolling(10).mean()
    hist\["ma20"\] = hist.close.rolling(20).mean()
    feed\[code\] = hist
  mytest = MyBackTest(feed)
  mytest.start()
  order\_lst = mytest.ctx.broker.order\_hist\_lst
  with open("report/order\_hist.json", "w") as wf:
    json.dump(order\_lst, wf, indent=4, default=str)
  stats = mytest.stat
  stats.data.to\_csv("report/stat.csv")
  print("策略收益: {:.3f}%".format(stats.total\_returns \* 100))
  print("最大回彻率: {:.3f}% ".format(stats.max\_dropdown \* 100))
  print("年化收益: {:.3f}% ".format(stats.annual\_return \* 100))
  print("夏普比率: {:.3f} ".format(stats.sharpe))
  plotter = Plotter(feed, stats, order\_lst)
  plotter.report("report/report.png")

项目地址

https://github.com/youerning/stock_playground


关于Python技术储备

学好 Python 不论是就业还是做副业赚钱都不错,但要学会 Python 还是要有一个学习规划。最后给大家分享一份全套的 Python 学习资料,希望提供给那些想学习 Python 的小伙伴们一点帮助!

保存图片微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

Python实现股票回测框架搭建,回测交易策略可行性。_第3张图片
一、Python所有方向的学习路线

Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
在这里插入图片描述

二、Python基础学习视频

② 路线对应学习视频

还有很多适合0基础入门的学习视频,有了这些视频,轻轻松松上手Python~在这里插入图片描述
在这里插入图片描述

③练习题

每节视频课后,都有对应的练习题哦,可以检验学习成果哈哈!
在这里插入图片描述
因篇幅有限,仅展示部分资料

三、精品Python学习书籍

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
在这里插入图片描述

四、Python工具包+项目源码合集
①Python工具包

学习Python常用的开发软件都在这里了!每个都有详细的安装教程,保证你可以安装成功哦!
在这里插入图片描述

②Python实战案例

光学理论是没用的,要学会跟着一起敲代码,动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。100+实战案例源码等你来拿!
在这里插入图片描述

③Python小游戏源码

如果觉得上面的实战案例有点枯燥,可以试试自己用Python编写小游戏,让你的学习过程中增添一点趣味!
在这里插入图片描述

五、面试资料

我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。
在这里插入图片描述
在这里插入图片描述

六、Python兼职渠道

而且学会Python以后,还可以在各大兼职平台接单赚钱,各种兼职渠道+兼职注意事项+如何和客户沟通,我都整理成文档了。
在这里插入图片描述

这份完整版的Python全套学习资料已经上传CSDN,朋友们如果需要可以保存图片微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

Python实现股票回测框架搭建,回测交易策略可行性。_第4张图片

你可能感兴趣的:(python,开发语言,数据分析,信息可视化,计算机网络,经验分享,学习)