一、前言
matplotlib【1】是著名的python绘图库,它提供了一整套绘图API,十分适合交互式绘图。本人在工作过程中涉及到股票数据的处理如绘制K线等,因此将matplotlib的使用心得进行整理,与大家共同分享。
另外,在数据处理过程中会用到numpy【2】,matplotlib网站的示例也有不少用到了numpy,读者可以参考这篇文章【3】有基本的了解。
本系列文章主要分为两部分:(1)matplotlib基本使用;(2)结合股票走势、技术指标等信息通过matplotlib进行绘制,学习其用法,个人觉得matplotlib博大精深,二八定理,20%的功能完成80%的图表需求。
最后,matplotlib作者英年早逝,感谢他所做出的贡献。John Hunter will be missed!
二、matplotlib基本使用
matplotlib中通过pyplot模块进行图表的绘制。所绘制的图表称为一个绘图对象,在绘图对象之上绘制各种图形。由于K线图主要是基于日期和股票价格的X-Y坐标轴结构,因此本系列文章也主要针对axes坐标轴绘制进行分析。
通过如下语句导入需要绘图的库:
importmatplotlib.pyplot asplt
1. figure对象
figure对象可以看成整个图表。在figure图表之上增加多个子图,然后在子图之上绘制点和线。
fig =plt.figure()ax =fig.add_subplot(1,1,1)
得到fig对象之后,通过add_subplot增加子图(返回了一个axes坐标轴),该方法需要三个参数,分别为:numrows, numcols, fignum。其中,一共有numrows*numcols个子图,即:将图表分为N行*M列,fignum标识了该子图的顺序,其范围从1到numrows*numcols。在上例中1,1,1表示了该绘图对象仅有1个子图,也就是1*1类型。
2. plot方法绘图
创建子图之后,通过plot方法在子图上绘制。plot方法可以传入两个list,分别表示X和Y坐标,因此x和y的长度要一致。需要注意的是,plot也可以接受一个list参数作为Y坐标的值,默认X坐标的值从0开始到Y的长度。
plt.plot([1,2,3,4])
其中X坐标为0到3,个数与Y坐标值的数目相同。
plt.plot([1,2,3,4],[1,2,3,4])
设置了X坐标的值。然后通过plot.show()显示该图,示例代码如下:
defPlotDemo1():fig =plt.figure()ax =fig.add_subplot(1,1,1)ax.plot([1,2,3,4],[2,3,4,5])plt.show()
图表如下所示:
上述图表作为基础,以后我们都是围绕这个基础图表不断添加元素,直到达到我们想要的效果。
2.1 增加标题和坐标轴说明
如果需要给绘图对象增加标题,可以通过suptitle方法设置,其中可以设置参数:标题、标题字体大小、字体类型等。代码示例如下:
fig.suptitle('figure title demo',fontsize =14,fontweight='bold')
如果需要对给定子图的坐标轴设置标题,可以通过刚才返回的axes对象的set_title进行设置,代码示例如下:
ax.set_title("axes title")
如果需要对于X和Y坐标设置标签,可以通过set_xlabel和set_ylabel方法设置。代码示例如下:
ax.set_xlabel("x label")ax.set_ylabel("y label")
图表如下所示:
通过上述的示例,我们绘制了一个基本的X和Y坐标轴,并增加了针对坐标轴的说明。
三、股价基本走势图
股票的K线图(以日K为例)由日期和价格组成,形成X-Y坐标轴,按照前面的绘图方案,需要传入日期数组和价格数组即可。
1.numpy数组
numpy是常用的数据处理库,我将000001.SZ的股价数据(时间范围从20150101到20150930)导入到csv中,然后通过numpy读取得到日期和价格数组。csv文件中包含了两列,日期和价格,分割符号为",",读取过程代码如下:
dates,close =np.loadtxt(filename,delimiter=",",unpack=True,converters={0:mdates.strpdate2num('%Y-%m-%d')})
numpy的loadtxt方法:设定了文件中的分隔符号为“,”,unpack是否将数组拆分,True为拆分,即:得到两个数组分别表示日期和收盘价格,converters是将日期类型的字符串转为数组,因为numpy规定其数组中的类型需要一致。
2.绘制基础走势图
通过numpy得到日期和收盘价格之后,参照先前的示例,通过plot方法进行绘制:
ax1.plot(dates,close)
图表如下所示:
在上图中,x轴通过数值标识,而不是日期类型。因为我们通过numpy构造数组时,日期按照数值类型存储,可以通过如下方法转换为日期类型:
ax1.xaxis.set_major_locator(mdates.DayLocator(bymonthday=range(1,32),interval=15))ax1.xaxis.set_major_formatter(mdates.DateFormatter("%Y-%m-%d"))forlabel inax1.xaxis.get_ticklabels():label.set_rotation(45)
X-轴设置主要刻度locator为每日刻度,格式为:DateFormatter("%Y-%m-%d"),每日刻度从第1日到第31日,间隔为15日。图表如下所示:
其中,对于X-轴上面的每个ticker标签都向右倾斜45度,这样标签不会重叠在一起便于查看。
也可以按照每月进行显示,X-轴设置主要刻度为每月刻度,格式为:DateFormatter("%Y-%m"),转换代码如下:
ax1.xaxis.set_major_locator(mdates.MonthLocator())ax1.xaxis.set_major_formatter(mdates.DateFormatter("%Y-%m"))
图表如下所示:
3.图形边框调整
细心的读者可能会发现,在上图中底部(bottom)处的日期标签,显示不完整。此时可以点击【configure subplots】按钮,调整左右和上下边框,然后保存即可。图表如下所示:
也可以通过subplots_adjust方法对于边框进行调整:
plt.subplots_adjust(bottom=0.13,top=0.95)
4.绘制价格平均线
在前面的示例中绘制了基本的股票走势图,本节我们利用ta-lib【4】证券技术指标库,绘制5日和10日价格平均线。
ta-lib中提供了方法talib.SMA得到价格简单平均线,timeperiod为时间参数,timeperiod=5为五日均线,基于上图增加五日和十日均线,代码如下:
sma5 =talib.SMA(close,timeperiod =5)ax1.plot(dates,sma5)sma10 =talib.SMA(close,timeperiod =10)ax1.plot(dates,sma10)
其中,sma5和sma10均为numpy数组。
图表如下所示:
在坐标轴中有三条曲线,matplotlib会自动改变线条颜色,此时如果没有说明并不方便使用,可以在右上角增加图例,表明各线条所代表的含义,并增加图表的网格效果,代码如下:
plt.legend(('daily','SMA5','SMA10'))plt.grid(True)
图表如下所示:
四、总结
本章对于matplotlib的基本使用方法进行了介绍,并绘制了基本的股票价格和均线走势图。在后面的章节中对于上述图表增加成交量、MACD值等数据。
最后还是那句俗得不能再俗的话,“本人水平有限,错误在所难免,欢迎批评指正。”
参考文献:
【1】http://matplotlib.org/index.html
【2】http://www.numpy.org/
【3】http://old.sebug.net/paper/books/scipydoc/numpy_intro.html
【4】https://github.com/mrjbq7/ta-lib