以股票weekday和涨幅关系为例创建dataframe交叉表与透视表

文章目录

  • 前言
  • 代码过程
  • 总结

前言

可以使用交叉表和透视表,来直观的看出两个变量的数值关系。本文以某一段时间的股票数据为例,创建星期几weekday和股票涨幅交叉表与透视表来直观看两个特征之间的关系。

代码过程

import pandas as pd
pd.set_option('display.max_rows',6)#设置dataframe最多显示6行
#读取数据
stock=pd.read_csv('stock_day.csv')
stock

以股票weekday和涨幅关系为例创建dataframe交叉表与透视表_第1张图片

#将表格中的行索引转换成日期,并提取成星期几的形式
date=pd.to_datetime(stock.index)
print("转换之后的date:{}".format(date))
print("date中的year:{}".format(date.year))
print("date中的month:{}".format(date.month))
print("date中的weekday:{}".format(date.weekday))

以股票weekday和涨幅关系为例创建dataframe交叉表与透视表_第2张图片

#将weekday添加到原来的数据表stock中
stock['weekday']=date.weekday
stock#weekday中0-4代表星期1-5

以股票weekday和涨幅关系为例创建dataframe交叉表与透视表_第3张图片

import matplotlib.pyplot as plt
#看看p_change中数据的分布情况
plt.scatter([i for i in range(643)],stock['p_change'])

以股票weekday和涨幅关系为例创建dataframe交叉表与透视表_第4张图片

import numpy as np
#把涨幅p_change中大于0的标记为1,小于0的标记为0
stock["vol"]=np.where(stock['p_change']>0,1,0)
stock

以股票weekday和涨幅关系为例创建dataframe交叉表与透视表_第5张图片

#创建week和Volatility的交叉表
crossTable=pd.crosstab(stock["weekday"],stock["vol"])
crossTable

以股票weekday和涨幅关系为例创建dataframe交叉表与透视表_第6张图片

#按行求和 然后表中的每个数值除以该行的行和,就把交叉表中的数值转化为百分比了
crossTable.div(crossTable.sum(axis=1),axis=0)

以股票weekday和涨幅关系为例创建dataframe交叉表与透视表_第7张图片

#交叉表可视化一下
crossTable.div(crossTable.sum(axis=1),axis=0).plot(kind="bar")

以股票weekday和涨幅关系为例创建dataframe交叉表与透视表_第8张图片

#创建一下透视表
pivotTable=stock.pivot_table(["vol"],index=["weekday"])
pivotTable

以股票weekday和涨幅关系为例创建dataframe交叉表与透视表_第9张图片

pivotTable.plot(kind="bar")#可视化一下

以股票weekday和涨幅关系为例创建dataframe交叉表与透视表_第10张图片

总结

本文通过股票的数据,创建了一下数据的交叉表与透视表。

你可能感兴趣的:(np,pd,df,mpl,TF,pytorch基本语法操作)