做量化用到的数据一般包括二级市场各种数据、宏观经济各种数据以及一些特殊需求的网页数据,需要有通过python获取数据。常见的获取数据方式有三种:
一是通过SQL语言从数据库获取数据,适用于二级市场和宏观经济的各种数据,已经有一些企业整理的非常好;
二是通过API接口获取数据,适用于WindPy,rqdatac,tushare,其中WindPy,rqdatac都是收费的,本文这里选择免费、开源的tushare来获取数据;
Tushare是一个免费、开源的python财经数据接口包。主要实现对股票等金融数据从数据采集、清洗加工 到 数据存储的过程,能够为金融分析人员提供快速、整洁和多样的便于分析的数据,在数据获取方面极大地减轻工作量,使人们更加专注于策略和模型的研究与实现上。
三是通过爬虫程序获取网站数据,适用于各种网站的留言、公告等。
步骤概要:
1.安装anaconda3;
2.在anaconda3安装tushare;
3.调用数据,获取股票数据。
详细步骤:
1、在anaconda官网:Anaconda | The World's Most Popular Data Science Platform下载符合电脑配置的软件(个人电脑Windows10环境,选择了Anaconda3-2022.10-Windows-x86_64.exe版本下载);
2、按照提示安装,按照过程中建议将路径添加到环境变量,否则后面还要在安装完软件后配置环境变量;
图1高级安装选项(建议两个都勾选)
3、安装成功的截图:
图2 安装成功后截图(在桌面找不到快捷图标)
4、安装成功后在电脑开始栏,搜索spyder打开,输入代码:
代码块:
import tushare as ts
data=ts.get_hist_data('600848')
print(data)
提示错误:ModuleNotFoundError: No module named 'tushare'。
上述错误表示tushare尚未安装,需要在Anaconda Prompt安装:
代码块如下:
pip install tushare -i https://pypi.tuna.tsinghua.edu.cn/simple/
5、在spyde输入代码,成功调用股票数据,如下图所示。
图3 股票信息成功调用