【泰阁志-数据分析】作业4:区间估计

  • 观测到的数据,可以在一定程度上认为接近总体均值
  • 观测多个数据,取样本均值,比观测一个数据更接近总体均值,观测数据越增加,样本均值接近总体均值的可能性越高。
    《极简统计学》

对于均值为μ、标准差为σ的一个正态总体的n个样本均值来说,其95%置信区间为下面的不等式解出来的范围,a为样本均值

-1.96 <= (a-μ)/(σ/√n)) <= +1.96

习题1:投掷N枚硬币,正面出现57次,尝试通过计算回答,假设N=100枚要舍弃还是要接受?

根据Tiger给的Tips,假设N=100,正面出现的枚数近似于平均值为50(100/2),S.D为5(sqrt(100)/2)的正态分布,95%预测置信区间为:

-1.96<= (N- 50)/5 <= 1.96
40.2<= N <= 59.8

而N=57在这个区间中,所以可采用。

习题2:随机抽样30个GRE成绩,平均分数为1082分,标准差为108分,决定下列参数的95%和99%置信区间

(1)总体均值
(2)总体标准差

n=30,μ=1082,σ=108

95%的置信区间
-1.96 <= (a-1082)/(108/√30)) <= 1.96
1043.35 ~ 1120.65

99%的置信区间
-2.58 <= (a-1082)/(108/√30)) <= 2.58
1031.13 ~ 1132.87

p.s. 统计学真的是一如既往的枯燥,难怪当年没学下去。现在是偏向虎山行啊,没有退路。

本文为 泰阁志-解密大数据第三次作业,了解更多请关注微信“泰阁志”。

【泰阁志-数据分析】作业4:区间估计_第1张图片
图片发自App

你可能感兴趣的:(【泰阁志-数据分析】作业4:区间估计)