美股量化交易回测学习笔记00-数据篇

美股量化交易回测学习笔记00-数据篇_第1张图片
图片来自网络

现在很多客户端提供市场数据,但只能作为观看,并不能做深入分析。另一方面,量化分析越来越火热的今日。分享自己的量化回测笔记。

既然要开始本地量化回测。首先是要有一个完整的行情数据。为了方便本教程。笔者选择美股市场上的一支股票来快速的开始量化策略分析。

行情数据获取

我们使用pytdx来获取美股的历史行情数据
pytdx是一个github的开源项目,通过访问通达信的行情服务器来获取美股市场数据。

1. 安装pytdx

笔者使用python2.7并且安装Anaconda包管理工具

pip install pytdx

2. 获取数据

a.可以通过获取市场列表来选择你想要获取的行情,这里笔者选择美股知名公司
markets = api.get_markets()
api.to_df(markets)

得到的市场如下(节选):

market name short_name
1 临时股 TP
4 郑州商品期权 OZ
5 大连商品期权 OD
6 上海商品期权 OS
8 上海个股期权 QQ
10 基本汇率 FE
11 交叉汇率 FX
31 香港主板 KH
40 中国概念股 CH
41 美股知名公司 MG
b.通过市场过滤,得到美股代码
df_inst = api.to_df(insts)
df_inst[df_inst['market'] == 41]

得到结果如下:


美股量化交易回测学习笔记00-数据篇_第2张图片
知名美股列表
c.获取历史日K线数据
from pytdx.params import TDXParams
his_kline = api.get_instrument_bars(TDXParams.KLINE_TYPE_DAILY, 40, "AAPL", 0, 300)
api.to_df(his_kline)
d.取日线,划张价格走势图(APPL-demo.csv)
import matplotlib.pyplot as plt
import datetime

def format(date):
    return datetime.datetime.strptime(str(date), "%Y%m%d")
df = datadf
df['time'] = df['year'] * 10000 + df['month'] * 100 + df['day']
plt.plot(df['time'].apply(lambda x : format(x)), df['close'])
美股量化交易回测学习笔记00-数据篇_第3张图片
苹果300天历史K线数据
e.保存为csv格式
#保存为csv格式,命名为APPL-demo/按照逗号分隔
datadf.to_csv(r'./APPL-demo.csv',index=False,sep=',')

至此获取任意股票的历史行情的教程到此结束。下一篇开始讲述量化回测

f.获取数据完整代码附上(spider.py)

(代码未经过优化处理,需要解决通信达超时重连问题,如需要自动化下载移步Githut)

#spider.py
from pytdx.exhq import TdxExHq_API
from pytdx.params import TDXParams
import pandas as pd
api = TdxExHq_API(heartbeat=True)
host = "180.153.18.176" #通信达的api地址
port = 7721 #通信达的连接端口
#开始连接通信达服务器
api.connect(host, port)
insts = []
count = 500
curr_index = 0
while (True) :
    insts_tmp = api.get_instrument_info(curr_index, count)
    if insts_tmp is None:
        break
    insts.extend(insts_tmp)
    curr_index = curr_index + len(insts_tmp)
    if len(insts_tmp) < count:
        break
#查看通信达提供的市场列表
#print api.to_df(api.get_markets())
df_inst = api.to_df(insts)
#这里笔者选择的美国知名公司列表, 所以market = 41
df_inst[df_inst['market'] == 41]
#这里教程获取AAPL单一数据,如果需要全部数据可以使用列表循环下载整个数据
#笔者获取的是苹果公司最近300天交易日行情Day版
his_kline = api.get_instrument_bars(TDXParams.KLINE_TYPE_DAILY, 41, "AAPL", 0, 300)
datadf = api.to_df(his_kline)
#保存为csv格式,命名为APPL-demo/按照逗号分隔
datadf.to_csv(r'./APPL-demo.csv',index=False,sep=',')

转载连接
pytdx官方说明文档

你可能感兴趣的:(美股量化交易回测学习笔记00-数据篇)