数据来源于锐思数据库平安银行2021年1月1日至7月1日股票收盘价数据,共119条,部分数据及数据格式如下:
这119天平安银行股票的日收盘价的均值为22.51
,标准差为1.44
。
根据均值-标准差分级法
对平安银行的股票日收盘价进行状态划分,如下图所示:
根据得到的状态分级表,对2021年1月1日至2021年7月1日期间的119条平安银行股票的日收盘价序列进行状态划分
结果如下图:
根据天数-状态等级图进一步得到转频数矩阵
和转移概率矩阵
为:
由一步转移频数矩阵可以得到边际概率值
为:p1=20/119,p2=21/119,p3=35/119,p4=25/119,p5=18/119。
统计量的值,如下表:
通过查看数据可得,7月1日的收盘价为23.2,处于稳定区间,设其状态N为:[0,0,1,0,0]
根据状态转移概率矩阵于7月1日状态矩阵预测2021年7月2日平安银行收盘价状态矩阵
为:
[0,0.212,0.588,0.2,0.158]
可得,7月2日股票处于稳定状态得概率大于50%,预测7月2日平安银行股票收盘价处于稳定状态,即在[21.78,23,22)区间内。
通过在锐思数据库中查看2021年平安银行7月2日得股票收盘价可知,该天得收盘价为21.8,处于稳定状态,表明预测成功。
import math
import numpy as np
import pandas as pd
import xlwt
data=pd.read_csv('lh期末.csv',encoding='gbk')
dadie=0
xiadie=0
wending=0
shangzhang=0
dazhang=0
a=[]
b=[]
c=[]
d=[]
e=[]
#print(data)
counter=np.array(data)
# print(list(counter[:,1]))
set=list(counter[:,1])
#按照范围将数据分段并统计不同分段的数的个数
# 第一天 平稳 2
# 第二天 大跌 3
# 第三天 平稳 4
# 第四天 平稳 5
# 第五天 上涨 6
for i in set:
if 0<i<21.06:
dadie=dadie+1
a.append(i)
elif 21.06<=i<21.78:
xiadie=xiadie+1
b.append(i)
elif 21.78<=i<23.22:
wending=wending+1
c.append(i)
elif 23.22<=i<23.94:
shangzhang=shangzhang+1
d.append(i)
elif i>=23.29:
dazhang=dazhang+1
e.append(i)
print("******************不同状态的数量*********************")
print("大跌个数为:",dadie)
print("下跌个数为:",xiadie)
print("稳定的个数为:",wending)
print("上涨的个数为:",shangzhang)
print("大涨的个数为:",dazhang)
# print(a)
# print(b)
# print(c)
# print(d)
# print(e)
#将不同数据原始数据里的是数据转换成等级
# for i in range(len(set)):
# if set[i]in a:
# set[i]=1
# elif set[i] in b:
# set[i]=2
# elif set[i] in c:
# set[i]=3
# elif set[i] in d:
# set[i]=4
# elif set[i] in e:
# set[i]=5
#print(set)
#print(n)
#将数据变成数据类型为[什么类型,第几天]
# set1=[]
# for i in range(len(set)):
# set1.append([i+1,set[i]])
# print(set1)
#制作1-119的数组
# hhh=[]
# for i in range(1,120):
# hhh.append(i)
# print(hhh)
#*********************************************************画图**************************************
# pyplot 是专门用来画图的存在于matplotlib里面的函数
# from matplotlib import pyplot as plt
#
# # 设置图片大小
# fig = plt.figure(figsize= (20,8),dpi = 80) # plt.figure用来设置图像大小,dpi参数调节图片清晰度
# x = [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 5, 4, 5, 5, 5, 5, 5, 4, 5, 4, 3, 3, 3, 3, 2, 2, 2, 3, 3, 3, 2, 1, 1, 2, 2, 2, 2, 2, 2, 1, 2, 2, 1, 1, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 1, 1, 1, 1, 1, 2, 2, 3, 3, 4, 3, 3, 4, 4, 4, 4, 5, 4, 4, 4, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 4, 4, 4, 5, 5, 5, 5, 5, 4, 4, 4, 3, 3, 3, 3, 3, 3, 4, 3, 3, 3, 3]
# y = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119]
# # x,y一起组成了要绘制图形的图标
#
# # 绘图
# # plot中参数的含义分别是横轴值,纵轴值,线的形状,颜色,透明度,线的宽度和标签
# plt.plot(x, y, 'ro-', color='black', alpha=1, linewidth=1) # 传入x,y绘制出折线图
# plt.xlabel('x轴数字')
# plt.ylabel('y轴数字')
# # 设置x轴刻度
# plt.xticks(x) # 设置x轴刻度 可以以plt.xticks(range(2,26))的样式来调节x刻度参数
# # 另一种一列表的形式来传递步长
# # _xtick_labels = [i/2 for i in range(4,49)]
# # plt.xticks(_xtick_labels) 同时也可以在这一步里面设置步长plt.xticks(_xtick_labels[::3])
# # 传y的时候 plt.yticks(range(min(y),max(y)+1)) +1以免最后一个取不到 直接最大值最小值 刻度不均匀,range无意义
# # 保存图片
# plt.savefig("./sig_size.png") # 保存图片 要在绘制之后保存 plt.savefig保存图片 保存为svg这种矢量图,放大不会有锯齿
#
# # 展示图形
# plt.show() # 在执行程序的同时显示出图形
#******************************************将数据导出为文件
# import openpyxl
# data = ... #此处是要写入的数据
# wb = openpyxl.Workbook()
# ws = wb.create_sheet("test")
#写数据函数cell,cell中column和row至少为1
# for i in range(1,len(set1)):
# for j in range(1,2):
# ws.cell(row=i, column = j, value = set1[i][j])
# import xlwt
# import xlrd
# #xlwt,xlrd是python将数据导入excel表格使用的库
#
# wb = xlwt.Workbook()
# # 添加一个表
# ws = wb.add_sheet('test')
#添加数据使用.write函数(横坐标,纵坐标,内容)注意横纵坐标从0开始,横纵坐标即对于excel而言
##################################################将数据导出为excel#########################
# for i in range(len(set1)):
# for j in range(0,2):
# ws.write(i, j, set1[i][j])
#例:ws.write(0, 0, '股票编号')
# ws.write(0, 0, a),a是变量
#将数据导出,保存格式为xxx.xls。其中xxx与上文表名同步
#注意此处一定要保存为.xls形式,如果是xlsx会打不开
# wb.save('succees.xls')
################################求转移矩阵和转移概率矩阵##################
# 转移频数矩阵
a = np.mat([[10,6,0,0,0],
[10,8,7,5,3],
[0,7,20,7,0],
[0,0,3,5,7],
[0,0,3,8,8]
])
# print(np.sum(a[0,:])) #计算行的和
# print(np.sum(a[:,0])) #计算列的和
# print(a[1,1])
#计算状态转移概率
sum=[]
for i in range(len(a)):
sum.append(np.sum(a[i,:]))
print("*********************行的和**********")
print(sum)
gaiv=[]
juzhen=[]
for i in range(len(sum)):
for j in range(len(sum)):
gaiv.append(a[i,j]/sum[i])
print("***************每种状态占总数量的比例***************************")
print(gaiv)
##############将数组分割成5x5的矩阵形式##################
print("*********************转移状态概率矩阵*******************")
arr = np.array(gaiv).reshape(5, 5)
print(arr)
#计算每个状态占总状态的个数
num=[20,21,35,25,18]
num2=[]
for i in range(len(sum)):
num2.append(num[i]/119)
# print(num2)
# print(math.log(2,4))
tongjil=[]
for i in range(0,5):
for j in range(0,5):
if arr[j,i]==0:
tongjil.append(0)
else:
tongjil.append(a[j,i]*math.fabs(math.log(arr[j,i]/num2[i],2.718)))
print("********************验证马氏性检验************************")
print(tongjil)
# print(num2)
arr_1 = np.array(tongjil).reshape(5, 5)
print("***************************将检验结果变成矩阵形式*******************")
print(arr_1)
# # 求矩阵转置
#print(np.transpose(arr_1))
arr_1=np.transpose(arr_1)
# print(np.sum(a[0,:])) #计算行的和
# print(np.sum(a[:,0])) #计算列的和
print("**************************矩阵的转置**************************")
hang=[]
lie=[]
for i in range(0,5):
hang.append(np.sum(arr_1[i,:]))
lie.append(np.sum(arr_1[:,i]))
print("***********************行的和和列的和*******************8")
print(hang,lie)
sumh=np.sum(hang)
suml=np.sum(lie)
#行和列的总和
print("*******************************行列加起来的和*****************************")
sumhl=sumh+suml
print(sumhl)
#np.array(tongjil).reshape(5, 5)
# 2021-07-01 23.2 稳定
yuce=[0,0,1,0,0]
resu=[]
for i in range(5):
yuce=np.dot(arr,yuce)
resu.append(yuce)
print("*************************预测未来五天的结果************************8")
print(np.array(resu).reshape(5, 5))