一项调查研究中,测量了50个研究生的身高和体重,同时记录了他们的饮食习惯包括在过去的三个月时间内,他们吃了多少次垃圾食品,数据在‘weight.txt‘中。

一项调查研究中,测量了50个研究生的身高和体重,同时记录了他们的饮食习惯包括在过去的三个月时间内,他们吃了多少次垃圾食品,数据在’weight.txt’中。问题1:通常会认为体重和身高是相关的,使用这个调查中数据,检验体重和身高是否相关。(建议:首先计算相关系数,然后进行统计推断系数,注意统计假设检验)。

注意,不仅要粘贴结果还需要指出相大系数的值,以及这里使用的统计检验方法和你的统计推断的结论。(10分)

q1 = read.table("1weight.txt",header = 1)
attach(q1)
# 计算相关系数
cor(q1$weight,q1$height)
## 相关检验
cor.test(q1$weight,q1$height)

使用的检验是cor.test,检验的结果p-value等于0,应该拒绝原假设,认为体重和身高是相关的,相关系数是0.7482279

问题2:试图建立一个线性模型来描述体重与身高和饮食习惯(使用在过去三个月的垃圾食物来衡量)的关系。检查变量的分布,并给出结论;(20分)

###  检查变量的分布
###  绘制直方图
par(mfrow = c(2,2))
hist(weight)
###  检验是否满足正态分布 
wilcox.test(weight)
hist(height)
wilcox.test(height)
hist(junkfood)
wilcox.test(junkfood)

体重与身高和饮食习惯,检验的结果的p值都是小于0.05,都不满足正态分布

建立一个线性模型来描述体重与身高和饮食习惯

##  线性模型
model = lm(weight ~ junkfood + height  )

你可能感兴趣的:(R语言大学作业,人工智能,python)