机器学习应用(一)-股票数据获取及处理

简介

pandas

Pandas模块是Python用于数据导入及整理的模块,对数据挖掘前期数据的处理工作十分有用。

quandl

Quandl上拥有超过500个与金融相关的数据集,里面的数据包括港股数据、沪深股、加拿大股票什么的,相关领域的朋友值得留意一下。并且支持使用Python与quandl这个package来直接获取相关数据。

举个例子,如果我要获取谷歌股票数据,那我可以直接用这句来获取:

df = quandl.get('WIKI/GOOGL')

案例代码

import pandas as pd
import quandl


# 1). 获取股票数据;
df = quandl.get('WIKI/GOOGL')
# print(df.head())
# print(df.describe())
# Adj. Close(adjusted closing price): 已调整收盘价
# Adj. Volume: 成交量
df = df[['Adj. Open', 'Adj. High', 'Adj. Low', 'Adj. Close', 'Adj. Volume']]

# 2). 数据处理
# HL_PCT(价格变化率)
df['HL_PCT'] = (df['Adj. High'] - df['Adj. Close']) / df['Adj. Close'] * 100
# PCT_change(收盘波动率)
df['PCT_change'] = (df['Adj. Close'] - df['Adj. Open']) / df['Adj. Open'] * 100

# 3). 打印及显示
df = df[['Adj. Close', 'HL_PCT', 'PCT_change']]
print(df.head())




运行结果

机器学习应用(一)-股票数据获取及处理_第1张图片

你可能感兴趣的:(机器学习应用(一)-股票数据获取及处理)