单样本t检验、独立样本t检验、配对样本t检验_python_数据分析_7

单样本t检验:检验单个变量的均值与目标值之间是否存在差异,如果总体均值已知,样本均值与总体均值之间差异显著性检验属于单样本t检验。
金融应用:
原假设为沪深300收益率均值为0,而p值为0.27>0.05(t值为1.1),所以在5%显著性水平下,不能拒绝原假设,推断沪深300的收益率均值为0。

独立样本t检验:用于检验两组服从正态分布的总体均值是否一样,前提是两个样本方差相等。如果两组样本彼此不独立,应该使用配对样本t检验。
金融应用:
原假设为沪深300、中证500样本收益率均值相等,而p值0.88>0.05,所以在5%显著性水平下,不能拒绝原假设,推断沪深300、中证500收益率均值相等。

配对样本t检验:用于两个样本并不互相独立,对两个总体的均值差异进行检验,原假设d=μ1-μ2=0,即假定两个总体均值相等。
金融应用:
原假设为沪深300、中证500样本收益率均值相等,而p值0.7>0.05,所以在5%显著性水平下,不能拒绝原假设,推断沪深300、中证500收益率均值相等。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy import stats
plt.rcParams['font.sans-serif'] = ['KaiTi'] # 指定默认字体
plt.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题

def get_data():
    #获取沪深300收益率数列
    HS300 = pd.read_excel('stocks.xlsx',sheet_name='510300',index_col=0)
    # print(HS300)
    HS300RET = HS300.loc[:, 'close'].pct_change()
    HS300RET = HS300RET[~np.isnan(HS300RET)]
    HS300RET = HS300RET * 100
    ZZ500 = pd.read_excel('stocks.xlsx',sheet_name='399905',index_col=0)

    ZZ500RET = ZZ500.loc[:, 'close'].pct_change()
    ZZ500RET = ZZ500RET[~np.isnan(ZZ500RET)]
    ZZ500RET = ZZ500RET * 100
    return HS300RET,ZZ500RET

hs300,zz500= get_data()
stocks = pd.DataFrame(hs300)
stocks.columns = ['hs300',]
stocks.loc[:,'zz500'] = zz500
hs = stocks.loc[:,'hs300']
zz = stocks.loc[:,'zz500']

#================================#
#单样本t检验,比较hs300收益率均值与0
print(hs300.head(10))
print(stats.ttest_1samp(hs300,0))
#================================#
#================================#
#独立样本t检验
print(stats.ttest_ind(hs300,zz500))
#================================#
#================================#
#配对样本t检验
print(stats.ttest_rel(hs,zz))
#================================#

单样本t检验、独立样本t检验、配对样本t检验_python_数据分析_7_第1张图片

你可能感兴趣的:(python_数据分析)