统计学--基于R(第3版)(基于R应用的统计学丛书)作者:贾俊平 习题答案 第七章

7.1

#7.1
#检验各月份的销量是否符合均匀分布(α=0.05)
#H0:符各均匀分布,H1:不符合均匀分布
load('C:/exercise/ch7/exercise7_1.RData')
exercise7_1
chisq.test(exercise7_1$销售量)
#在该次检验中,X-squared = 80.924, df = 11, p-value = 9.778e-13,p<0.05,拒绝原假设,各月份的销售量不符合均匀分布

7.2

#7.2
#检验是否逃课与学生性别是否独立(α=0.05)
load('C:/exercise/ch7/exercise7_2.RData')
exercise7_2
#H0:逃课与学生性别独立,H1:逃课与学生性别不独立
x<-c(34,38,28,50) #输入频数向量
M<-matrix(x,nr=2,nc=2,byrow=TRUE,dimnames=list(c("逃过课","未逃过课"),c("男","女"))) #生成列联表M
chisq.test(M) #检测列联表M
#在该次检验中,X-squared = 1.5407, df = 1, p-value = 0.2145,p>0.05,接受原假设,逃课与学生性别独立

7.3

#7.3
#检验上市公司的类型与对股价波动的关注程度是否独立(α=0.05)
load('C:/exercise/ch7/exercise7_3.RData')
exercise7_3
#H0:上市公司的类型与对股价波动的关注程度独立,H1:上市公司的类型与对股价波动的关注程度不独立
x<-c(50,70,30,15,20,5)
M<-matrix(x,nr=3,nc=2,byrow=TRUE,dimnames=list(c("主板企业","中小板企业","创业板企业"),c("关注","不关注")))
chisq.test(M)
#在该检验中,X-squared = 16.854, df = 2, p-value = 0.0002189,p<0.05,拒绝原假设,上市公司的类型对股价波动的关注程度不独立

7.4

#7.4
#检验地区与汽车价格是否独立(α=0.05)
#H0:地区与汽车价格独立,H1:地区与汽车价格不独立
load('C:/exercise/ch7/exercise7_4.RData')
exercise7_4
x<-c(20,40,40,50,60,50,30,20,20,40,20,10)  #此处我书上的数据和exercise7_4.RData中的数据有两处不一样,采用的exercise中的数据
M<-matrix(x,nr=4,nc=3,byrow=TRUE,dimnames=list(c("10万元以下","10—20万元","20—30万元","30万元以上"),c("东部地区","中部地区","西部地区")))
chisq.test(M)
#在该检验中,X-squared = 29.991, df = 6, p-value = 3.946e-05,p<0.05,拒绝原假设,地区与汽车价格不独立

7.5

#7.5
#计算φ系数、Cramer's V系数和列联系数
load('C:/exercise/ch7/exercise7_3.RData')
exercise7_3
x<-c(50,70,30,15,20,5)
M<-matrix(x,nr=3,nc=2,byrow=TRUE,dimnames=list(c("主板企业","中小板企业","创业板企业"),c("关注","不关注")))
M
library(vcd)
assocstats(M)
#结果显示如下:
#Phi-Coefficient   : NA
#Contingency Coeff.: 0.285
#Cramer's V        : 0.298
#φ系数单求一下:
chisq.test(M)  #得到 X-squared = 16.854
X = 16.854
n=190
φ=sqrt(X/n)
φ
#综上φ系数为0.2978343,Cramer's V系数为0.298,列联系数为0.285,三个系数均显示上市公司类型与对股价波动的关注程度之间存在一定的相关性

7.6

#7.6
#计算φ系数、Cramer's V系数和列联系数
load('C:/exercise/ch7/exercise7_4.RData')
exercise7_4
x<-c(20,40,40,50,60,50,30,20,20,40,20,10)
M<-matrix(x,nr=4,nc=3,byrow=TRUE,dimnames=list(c("10万元以下","10—20万元","20—30万元","30万元以上"),c("东部地区","中部地区","西部地区")))
M
library(vcd)
assocstats(M)
#结果显示如下:
#Phi-Coefficient   : NA
#Contingency Coeff.: 0.264
#Cramer's V        : 0.194
#φ系数单求一下:
chisq.test(M)  #X-squared = 29.991
X = 29.991
n=400
φ=sqrt(X/n)
φ
#综上所述,φ系数为0.2738202,Cramer's V系数为0.194,列联系数为0.264,三个系数均显示地区与汽车价格之间存在一定的相关性

你可能感兴趣的:(r语言,大数据)