先声明,本博客为个人作业不一定为标准答案,仅供参考。
H₀:销售量符合均匀分布
H₁:销售量不符合均匀分布
> example7_1<-read.csv("D:/作业/统计学R/《统计学—基于R》(第4版)—例题和习题数据(公开资源)/exercise/chap07/exercise7_1.csv")
> chisq.test(example7_1$销售量)
Chi-squared test for given probabilities
data: example7_1$销售量
X-squared = 80.924, df = 11, p-value = 9.778e-13
p-value = 9.778e-13<0.05,拒绝原假设,销售量不符合均匀分布
H₀:是否逃课与学生性别独立
H₁:是否逃课与学生性别不独立
> example7_2<-read.csv("D:/作业/统计学R/《统计学—基于R》(第4版)—例题和习题数据(公开资源)/exercise/chap07/exercise7_2.csv")
> M<-as.matrix(example7_2[,2:3]) //取包含所要对比数据的两列
> chisq.test(M)
Pearson's Chi-squared test with Yates' continuity correction
data: M
X-squared = 1.5407, df = 1, p-value = 0.2145
p-value = 0.2145>0.05,不拒绝原假设,是否逃课与学生性别独立
(1)
H₀:上市公司的类型与对股价波动的关注程度独立
H₁:上市公司的类型与对股价波动的关注程度不独立
> example7_3<-read.csv("D:/作业/统计学R/《统计学—基于R》(第4版)—例题和习题数据(公开资源)/exercise/chap07/exercise7_3.csv")
> M<-as.matrix(example7_3[,2:3])
> chisq.test(M)
Pearson's Chi-squared test
data: M
X-squared = 16.854, df = 2, p-value = 0.0002189
p-value = 0.0002189<0.05,拒绝原假设,上市公司的类型与对股价波动的关注程度不独立
(2)
> install.packages("vcd")
> library(vcd)
> assocstats(M)
X^2 df P(> X^2)
Likelihood Ratio 17.557 2 0.00015404
Pearson 16.854 2 0.00021891
Phi-Coefficient : NA
Contingency Coeff.: 0.285
Cramer's V : 0.298
由于Phi-Coefficient(Phi系数)只用于2*2列联表的相关性度量,所以输出结果为NA,Contingency Coeff(列联系数)=0.285,Cramer's V=0.298,关联系数均较低,表示关系较弱
(1)
H₀:地区与汽车价格独立
H₁:地区与汽车价格不独立
> example7_4<-read.csv("D:/作业/统计学R/《统计学—基于R》(第4版)—例题和习题数据(公开资源)/exercise/chap07/exercise7_4.csv")
> M<-as.matrix(example7_4[,2:4])
> chisq.test(M)
Pearson's Chi-squared test
data: M
X-squared = 29.991, df = 6, p-value = 3.946e-05
p-value = 3.946e-05<0.05,拒绝原假设,地区与汽车价格不独立
(2)
> library(vcd)
> assocstats(M)
X^2 df P(> X^2)
Likelihood Ratio 30.683 6 2.9134e-05
Pearson 29.991 6 3.9455e-05
Phi-Coefficient : NA
Contingency Coeff.: 0.264
Cramer's V : 0.194
由于Phi-Coefficient(Phi系数)只用于2*2列联表的相关性度量,所以输出结果为NA,Contingency Coeff(列联系数)=0.264,Cramer's V=0.194,关联系数均较低,表示关系较弱
本次记录就到这~