统计检验笔记

统计检验笔记

显著性检验可以分为参数检验和非参数检验。参数检验要求样本来源于正态总体(服从正态分布),且这些正态总体拥有相同的方差,在这样的基本假定(正态性假定和方差齐性假定)下检验各总体均值是否相等,属于参数检验。

当数据不满足正态性和方差齐性假定时,参数检验可能会给出错误的答案,此时应采用基于秩的非参数检验。

单样本t检验

  • 指的是 某类样本跟某个均值的对比 比如大一新生身高 跟往年均值的差异
  • https://www.cnblogs.com/qiuyuyu/p/9630410.html

独立样本T检验

  • 指的是两个类别之间均值的对比,例如大一男女身高的对比
  • https://blog.csdn.net/yijiaobani/article/details/78113404

配对样本T检验

  • 配对检验是基于对同一样本中相同个体的多次测量数据的检验;独立检验是对于不同样本的个体的测量数据
  • 配对配对检验两组样本样本量一致,两组样本观测先后顺序一一对应,http://www.docin.com/p-1520927774.html
  • https://zhidao.baidu.com/question/287293483.html
  • https://blog.csdn.net/yijiaobani/article/details/78113404

Mann-Whitney U检验(非参数):

  • 也叫Mann–Whitney–Wilcoxon (MWW), Wilcoxon rank-sum test, or Wilcoxon–Mann–Whitney test,是一种非参数秩和假设检验,对独立样本进行的一种不要求正态分布的t-test检验方法。主要是对来自除了总体均值以外完全相同的两个总体,检验其是否具有显著差异,样本大小大于20时,检验的效果最好
  • https://www.jianshu.com/p/8c0e7ce7a290
  • https://www.cnblogs.com/webRobot/p/6852072.html

Kolmogorov-Smirnov(非参数):

  • 是比较一个累积分布f(x)与理论分布g(x)或者两个观测累积分布 是否有显著差异的检验方法。其原假设H0:两个数据分布一致或者数据符合理论分布。D=max| f(x)- g(x)|,当实际观测值D>D(n,α)则拒绝H0,否则则接受H0假设。
  • KS检验与t-检验之类的其他方法不同是KS检验不需要知道数据的分布情况,可以算是一种非参数检验方法
  • https://blog.csdn.net/weixin_33849215/article/details/85816750?utm_medium=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.channel_param&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.channel_param
  • https://blog.csdn.net/qq_41679006/article/details/80977113

方差分析(Analysis of Variance,简称ANOVA)

  • 用于两个及两个以上样本均数差别的显著性检验
  • 方差分析必须满足两条假设,分别是正态性假定和方差齐性假定;因变量是连续变量用ANOVA
  • https://blog.csdn.net/weixin_33796205/article/details/93880934
  • 方差分析结果为显著时候,可以进一步进行多重比较。举例当检验到广州四季温度存在显著差异时,可以进一步看哪些季节间温度差异更大,哪个季节温度高于另一季节等。
  • (多重比较) https://blog.csdn.net/huangguohui_123/article/details/103966000?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522160257348419724836709301%2522%252C%2522scm%2522%253A%252220140713.130102334…%2522%257D&request_id=160257348419724836709301&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2allfirst_rank_ecpm_v3~pc_rank_v2-2-103966000.first_rank_ecpm_v3_pc_rank_v2&utm_term=LSD%E6%B3%95&spm=1018.2118.3001.4187
  • (多重比较) https://blog.csdn.net/yuehedou/article/details/78879542?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522160257328819724835842805%2522%252C%2522scm%2522%253A%252220140713.130102334…%2522%257D&request_id=160257328819724835842805&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2allfirst_rank_ecpm_v3~pc_rank_v2-3-78879542.first_rank_ecpm_v3_pc_rank_v2&utm_term=%E5%A4%9A%E9%87%8D%E6%AF%94%E8%BE%83&spm=1018.2118.3001.4187
  • (多重比较)https://zhuanlan.zhihu.com/p/44880434

Kruskal-Wallis检验

  • Kruskal-Wallis检验又被称之为单因素非参数方差分析,是基于秩和的非参数版的anova1。用于检验两个/多个独立样本分布有无显著差异
  • 因变量是分类变量用KW检验
  • 同理,KW检验结果为显著时候,可以进一步进行多重比较。通过Dunn检验(基于秩和)
  • https://wenku.baidu.com/view/6a7fcedf05a1b0717fd5360cba1aa81144318fe4.html
  • (多重比较)链接:https://pan.baidu.com/s/1Z3MI5VJx-02BK-WjsbMpQQ
    提取码:q8r9
    复制这段内容后打开百度网盘手机App,操作更方便哦–来自百度网盘超级会员V1的分享
  • (多重比较)https://scikit-posthocs.readthedocs.io/en/latest/generated/scikit_posthocs.posthoc_dunn/#r3479789aefed-1

Z检验

  • Z检验用来判断样本均值是否与总体均值具有显著性差异。Z检验是通过正态分布的理论来推断差异发生的概率,从而比较两个均值的差异是否显著。Z检验适用于:a)总体呈正态分布。b)总体方差已知(不是样本方差)。c)样本容量较大(≥30)

  • https://blog.csdn.net/ws19920726/article/details/105831471?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522159866971319724839862206%2522%252C%2522scm%2522%253A%252220140713.130102334…%2522%257D&request_id=159866971319724839862206&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2allfirst_rank_ecpm_v3~pc_rank_v3-1-105831471.pc_ecpm_v3_pc_rank_v3&utm_term=Z%E6%A3%80%E9%AA%8C&spm=1018.2118.3001.4187

  • Z检验用于A/B test

  • https://blog.csdn.net/u012160689/article/details/16343875?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522159866919819195265923560%2522%252C%2522scm%2522%253A%252220140713.130102334…%2522%257D&request_id=159866919819195265923560&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2allfirst_rank_ecpm_v3~pc_rank_v3-1-16343875.pc_ecpm_v3_pc_rank_v3&utm_term=A%2FB+test&spm=1018.2118.3001.4187

  • https://blog.csdn.net/buracag_mc/article/details/74905483?biz_id=102&utm_term=A/B%20test%20python&utm_medium=distribute.pc_search_result.none-task-blog-2allsobaiduweb~default-0-74905483&spm=1018.2118.3001.4187

统计检验笔记_第1张图片

卡方检验

  • 用于对label不同的subgroup的分类变量进行比较。
  • 属于非参数检验,主要是比较两个及两个以上样本率(构成比)以及两个分类变量的关联性分析。根本思想在于比较理论频数和实际频数的吻合程度或者拟合优度问题。
  • https://www.zhihu.com/question/63191726
  • https://blog.csdn.net/ludan_xia/article/details/81737669
  • python实现:https://www.cnblogs.com/webRobot/p/6943562.html

levene方差齐性检验

  • http://www.doc88.com/p-3744294882312.html
    统计检验笔记_第2张图片

你可能感兴趣的:(笔记)