在可以用python获取基金持股情况并按一定条件过滤的基础上,可以用可视化来对获取的数据进一步分析,更直观,更易懂。
以下是代码:
!/usr/bin/env python
-- encoding: utf-8 --
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
import tushare as ts
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import os.path
if os.path.exists("./t1.csv") and os.path.exists("./t2.csv") and os.path.exists("./t3.csv"):
#t1 = pd.read_csv('./t1.csv', sep=',')
#t2 = pd.read_csv('./t2.csv', sep=',')
#t3 = pd.read_csv('./t3.csv', sep=',')
t1=pd.read_json("./t1.csv")
t2= pd.read_json("./t2.csv")
t3= pd.read_json("./t3.csv")
else:
t1= ts.fund_holdings(2017,1)
t2= ts.fund_holdings(2017,2)
t3= ts.fund_holdings(2017,3)
with open('t1.csv', 'w') as f:
f.write(t1.to_json())
with open('t2.csv', 'w') as f:
f.write(t2.to_json())
with open('t3.csv', 'w') as f:
f.write(t3.to_json())
t1.columns = t1.columns.str.replace('nums', 'nums1')
t2.columns = t2.columns.str.replace('nums', 'nums2')
t3.columns = t3.columns.str.replace('nums', 'nums3')
r1 = pd.merge(t1, t2, how='left',on=['code'])
r2=pd.merge(r1,t3,how='left',on=['code'])
g_data= r2[(r2["nums3"]>r2["nums2"])&(r2["nums2"]>r2["nums1"])][["code","name","nums3","nums2","nums1"]].sort_values(by=['nums3']).drop_duplicates(['code'])
means_frank =g_data["nums2"].values.tolist()# (90, 55, 40, 65)
means_guido =g_data["nums3"].values.tolist()# (85, 62, 54, 20)
means_first =g_data["nums1"].values.tolist()# (85, 62, 54, 20)
data to plot
n_groups = len(g_data)
create plot
fig, ax = plt.subplots() #生成图层,默认为一个
index = np.arange(n_groups) #生成用于迭代的变量
bar_width = 0.35 #条形宽度
opacity = 0.8 #透明度
rect1 = plt.bar(index, means_frank, bar_width,
alpha=opacity,
color='b',
label='S2')
rect2 = plt.bar(index + bar_width, means_guido, bar_width,
alpha=opacity,
color='g',
label='S3')
rect3 = plt.bar(index - bar_width, means_first, bar_width,
alpha=opacity,
color='y',
label='S1')
plt.xlabel('Name of Stock', fontsize=14)
plt.setp(ax.get_xticklabels(), color="red")
plt.ylabel('Funds for Stock', fontsize=14)
plt.title('The Increasing Of Stock By Funds, 2017', fontsize=24)
title_col=g_data["code"].values.tolist()
plt.xticks(index + bar_width, title_col,rotation='vertical',
verticalalignment='bottom') #相应代码垂直沉底放置于三季度条形图上
plt.legend(loc=2) #设置图例位置
plt.tight_layout()
plt.show()
代码解析:
1、获取数据同上一课内容雷同,只是对条件过滤多加了一个和(&)条件,注意敲代码时不能忘了并列条件要加括号;g_data为按条件过滤后,按关键字条件择取相应数据,并以三季度基金数据进行排序,最后再以code去重;打印出的g_data是这样的:
可见g_data仍然为一DataFrame数据;
2、means代表的几个变量分别为按季度数据将其转换为列表格式,也就是几个变量都是列表;便于后续作图;
3、n_groups为对g_data按索引取长度;因为要成条形图,并且比较各季度数据,需要提取是哪几只股票;按打印出的g_data是八支股票的数据;
4、np.arange(num),作用跟range类似,只不过支持步长为小数,用于迭代;将其赋予index变量;
5、rect1,rect2,rect3,分别为以2季度、3季度、1季度数据绘制条形图,可以看出,第一个位置实参为条形的位置,第二个位置实参为成图数据,第三个位置实参为条形宽度,关键字实参分别代表,颜色,标签,透明度;其中可见,绘图时首先以index为初始位置,2季度数据线绘制条形,三季度紧挨着2季度,可以用index加一个条形宽度定位,一季度为减一个条形宽度定位;
6、其余就是设置图形的相关配置;其中setp为获取ax子图层的x参数标签,并作用于一系列条形图对象;
7、plt.xticks为设置当前X轴刻度,用特定方式显示股票代码,因为我的显示不出汉子,所以变通了下;结果是这样的: