我们有时候很忙,忙得忘记看股票。有没有办法能辅助我们来分析我们关注的股票呢?
Pandas库提供了专门从财经网站获取金融数据的API接口,可作为量化交易股票数据获取的另一种途径。
我们可以通过python来做简单的数据分析,就可以得到股票的各种走势,辅助我们来操作了。
DataReader方法介绍
查看Pandas的手册可以发现,第一个参数为股票代码,苹果公司的代码为"AAPL",国内股市采用的输入方式“股票代码”+“对应股市”,上证股票在股票代码后面加上“.SS”,深圳股票在股票代码后面加上“.SZ”。DataReader可从多个金融网站获取到股票数据,如“Yahoo! Finance” 、“Google Finance”等,这里以Yahoo为例。第三、四个参数为股票数据的起始时间段。返回的数据格式为DataFrame。
首先我们得安装包:
pip install pandas
pip install pandas-datareader
然后将其引用进来
from pandas import DataFrame, Series
import numpy as np
import pandas as pd
import pandas_datareader.data as web
import datetime
start = datetime.datetime(2020,1,1)#获取数据的时间段-起始时间
end = datetime.date.today()#获取数据的时间段-结束时间
stock = web.DataReader("600797.SS", "yahoo", start, end)#获取浙大网新2020年1月1日至今的股票数据
也可这样获取数据:
all_data = {
ticker: web.get_data_yahoo(ticker) for ticker in ['AAPL', 'IBM', 'MSFT', 'GOOG']
}
price = pd.DataFrame({
ticker: data['Adj Close'] for ticker, data in all_data.items()
})
volume = pd.DataFrame({
ticker: data['Volume'] for ticker, data in all_data.items()
})
拿到这些数据,我们可以对数据进行处理:
DataFrame数据中增加涨/跌幅列,涨/跌=(当日Close-上一日Close)/上一日Close*100%
(1)添加一列change,存储当日股票价格与前一日收盘价格相比的涨跌数值,即当日Close价格与上一日Close的差值,1月3日这天无上一日数据,因此出现缺失
change = stock.Close.diff()
stock['Change'] = change
print stock.head(5)
(2)对缺失的数据用涨跌值的均值就地替代NaN。
change.fillna(change.mean(),inplace=True)
(3)计算涨跌幅度有两种方法,pct_change()算法的思想即是第二项开始向前做减法后再除以第一项,计算得到涨跌幅序列。
stock['pct_change'] = (stock['Change'] /stock['Close'].shift(1))#
stock['pct_change1'] = stock.Close.pct_change()
OK,这些数据看得眼花,我们可以用图表更直观的展现出来,举个例子:
绘制 2019 年到今天2019-02-15 (goole公司 ) 的股票趋势 ( open:开盘价, close: 收盘价, high 最高价:, low: 最低价,单位为美元)
import matplotlib.pyplot as plt
import pandas as pd
import pandas_datareader.data as web
import matplotlib
import time
import matplotlib.pyplot as plt
import argparse
def drawStockTrend(inc, startDate, endDate, pngFile):
fig = matplotlib.pyplot.gcf()
fig.set_size_inches(18.5, 10.5)
df = web.DataReader(name=inc, data_source='iex', start=startDate, end=endDate)
print(df)
plt.style.use('seaborn-whitegrid')
plt.xticks(rotation=30)
plt.plot(df.index, df['open'], label='open', marker='o', linestyle=':', linewidth=1, markersize=3, color='gray')
plt.plot(df.index, df['high'], label='high', marker='o', linestyle=':', linewidth=1, markersize=3, color='green')
plt.plot(df.index, df['low'], label='low', marker='o', linestyle=':', linewidth=1, markersize=3, color='blue')
plt.plot(df.index, df['close'], label='close', marker='o', linestyle='-', linewidth=2, markersize=6, color='red')
for x, y in zip(df.index, df['close']):
plt.text(x, y + 0.3, '%.2f' % y, ha='center', va='bottom', color='red')
plt.legend()
plt.title("%s' stock trend" % company)
plt.show(block=True)
time.sleep(1)
if(not pngFile):
fig.savefig(pngFile)
plt.close()
if __name__ == "__main__":
parser = argparse.ArgumentParser()
parser.add_argument('-c', action='store', dest='company', help='specify company')
parser.add_argument('-s', action='store', dest='start', help='specify start date')
parser.add_argument('-e', action='store', dest='end', help='specify end date')
parser.add_argument('-f', action='store', dest='file', help='specify the filename')
args = parser.parse_args()
company = 'CSCO'
startDate = '2019-01-01'
endDate = '2019-02-19'
pngFile = None
if(args.company):
company = args.company
if (args.start):
startDate = args.start
if (args.end):
endDate = args.end
if (args.file):
pngFile = args.file
drawStockTrend(company, startDate, endDate, pngFile)
运行一下:
python stock.py -c GOOGL -s 2019-01-01 -e 2019-02-19 -f google_stock_trend.png
这样就很直观看出各种走势了。
如果能定时将其发到我们微信或者其它通信工具上。即使再忙,也不太可能错过一个亿的机会了。
更多精彩,请关注微信公众号:python爱好部落