我毕业设计是设计一个金融领域的知识图谱,然后结合nlp技术进行金融风险分析。这个项目是我导师和企业合作项目下面的一个子项目,结果合作方一直没给我数据,为了顺利毕业,只好自己想办法找数据。
有个认识的学长跟我推荐了两个平台,tushare和聚宽。我简单看了两个平台,里面的金融数据都很齐全,包含了股票、基金、行业等,反正做我的毕设肯定是够用的。最关键的是,两个平台都有免费试用的方法。
我最后选用的是tushare。主要原因不是聚宽不好用,纯粹是thshare上手蛮快的,直接解决需求了,就没有再去研究聚宽。不过,聚宽里面文档写得很详细,各种api的参数列举的很细致,还介绍了挺多金融概念的,有这方面需求可以去瞧瞧。
平台链接:https://tushare.pro
tushare有个积分制度,具备一定积分级别的用户才能调用该等级的api。
流程大概就是:注册,完善信息,然后加tushare的群。完成这个流程后就可以攒够大部分场景所需数据的积分值了。
使用python调用tushare的api前,需要先下载tushare库,直接看官方文档就好了: tusaher安装
个人认为,tushare平台上最香的就是数据工具部分,特别的省事:
简单地勾选就能确定所需的数据类别
点击运行调试就能查看结果。可以直接导出csv结果,也可以点生成代码键,得到获取数据的python代码。python代码只要是针对需要实时数据的需求,如果没有这种需求,直接导出csv结果就够用了。