统计学 分类数据分析

统计学 分类数据分析

  • 分类数据和 x 2 x^2 x2统计量
  • 拟合优度检验
  • 列联分析: 独立性检验
  • 列联表的相关系(三个系数)

1.分类数据和 x 2 x^2 x2统计量

分类数据

统计学 分类数据分析_第1张图片

x 2 x^2 x2统计量

统计学 分类数据分析_第2张图片
其中 k为求和的项数, l 为要估计的参数个数
具体的参数含义可以结合下面的案例来理解

2.拟合优度检验

直接进入案例

例1

统计学 分类数据分析_第3张图片

  • 步骤1:分析 H0与H1
    H0 :观察频数与期望频数一致

  • 步骤2: 构造统计量
    统计学 分类数据分析_第4张图片

    • 1.在本题中不用估计参数,参与求和的项数为2,所以自由度为2-0-1=1
    • 2.根据原来的男女比例估计期望的男女存活 的人数统计学 分类数据分析_第5张图片
    • 3.代入计算
  • 步骤3.得出结论
    统计学 分类数据分析_第6张图片

例2

统计学 分类数据分析_第7张图片

  • 步骤1:分析 H0与H1
    H0 :观察频数与期望频数一致
  • 步骤2: 构造统计量
    统计学 分类数据分析_第8张图片
    • 1.在本题中估计参数为λ,l=1,参与求和的项数为4,所以自由度为2-0-1=1
      注,这里的 k=4是因为手动把 >=3的数据都归为一类
      λ的估计: 因为H0假设服从参数为λ的泊松分布,泊松分布的表达式入下
      在这里插入图片描述
      因此使用频数分布表计算出期望
      λ = 0 ∗ 109 / 200 + 1 ∗ 65 / 200 + 2 ∗ 22 / 200 + 3 ∗ 3 / 200 + 4 ∗ 1 / 200 = 0.6100000000000001 ≈ 0.61 λ = 0*109/200 + 1*65/200+2*22/200+3*3/200+4*1/200=0.6100000000000001 ≈0.61 λ=0109/200+165/200+222/200+33/200+41/200=0.61000000000000010.61
      根据泊松分布的表达式计算出k为0,1,2,3时的概率,得到下表统计学 分类数据分析_第9张图片
      带入公式求得统计量
  • 步骤3: 带入得出结论统计学 分类数据分析_第10张图片

3.列联分析: 独立性检验

RT/CT为该行/列的求和
统计学 分类数据分析_第11张图片
在这里插入图片描述
话不多说,看例题来理解

例1

统计学 分类数据分析_第12张图片
统计学 分类数据分析_第13张图片
解析
H0:地区和原料等级之间是独立的(不存在依赖关系)
H1:地区和原料等级之间不独立 (存在依赖关系)
计算
其中 45.36 = 140 / 500 ∗ 162 / 500 ∗ 500 = 140 ∗ 162 / 500 = 45.36=140/500*162/500*500=140*162/500= 45.36=140/500162/500500=140162/500=
统计学 分类数据分析_第14张图片
统计量
自由度为(3-1)*(3-1)=4
累加 ( 52 − 45.36 ) 2 / 45.36 以 此 类 推 (52-45.36)^2/45.36 以此类推 (5245.36)2/45.36
得出结论
统计学 分类数据分析_第15张图片

4.3个相关系数的计算

注,下文中的 x 2 x^2 x2均为统计量

统计学 分类数据分析_第16张图片统计学 分类数据分析_第17张图片
统计学 分类数据分析_第18张图片

你可能感兴趣的:(#,统计学,统计学)