参数检验和非参数检验的区别:
期刊文献中常规数据的主流统计检验方法分为两种:
以T检验、方差分析等为代表的参数检验;以秩和检验、卡方检验为代表的非参数检验
参数检验:假定数据服从某分布(一般为正态分布),通过样本参数的估计量(x±s)对总体参数(μ)进行检验,比如t检验、u检验、方差分析。
非参数检验:不需要假定总体分布形式,直接对数据的分布进行检验。由于不涉及总体分布的参数,故名 非参数 检验。比如,卡方检验,秩和检验。
参数检验的集中趋势的衡量为均值,而非参数检验为中位数。
参数检验需要关于总体分布的信息;非参数检验不需要关于总体的信息。
参数检验只适用于变量,而非参数检验同时适用于变量和属性。
简而言之,若可以假定样本数据来自具有特定分布的总体,则使用参数检验。如果不能对数据集作出必要的假设,则使用非参数检验。
利用ggstatsplot包进行数据统计检验分析和呈图,很舒服。要注意 type = "noparametric" 参数,自己判断是要非参数检验还是参数检验
提取统计数据:ggbetweenstats(data, x, y) %>% extract_stats()
正态性检验,同方差性检验
方差相同的两样本T检验,方差不同的两样本T检验
其实T检验只需满足一个条件,那就是正态,方差不齐的情况也可以用T检验。两独立样本T检验就是方差相同的两样本T检验,满足两个条件,正态且方差齐性。如果F检验把方差齐性的零假设给reject了,即方差不同,那么可用Welch t检验。方差是否相同,可以计算两个样本的方差比值,方差相同,则比值应该在1左右,而方差不同,则比值会偏离1,这个比值称为F ratio,可以使用F检验来计算方差齐性的显著性。(https://guangchuangyu.github.io/statistics_notes/t.html)
但好像论文中这种情况,一般直接用非参数检验,好像更为稳健。
正态性检验:R 的 shapiro.test 函数可检验数据是否服从整体分布, 若 p 大于0.05,表示与正态分布无显著差异,即样本服从正态分布。shapiro.test() 在 R 中有一个限制,它最多只能应用于大小为 5000 的样本,并且最小样本大小必须为 3。有一个假设检验,称为 Anderson Darling 正态性检验可替代shapiro.test 函数。加载 nortest 包并使用 ad.test() 函数即可。https://www.jianshu.com/p/0f6e6ba8b6b4
同方差性检验:使用F检验,var.test() 函数检验两组样本方差是否具有显著差异, 若 p 大于0.05,即两组样本的方差没有显著差异,方差齐次。
正态性检验和同方差性检验下面都有例子
所谓双侧和单侧之别,是以做检验时拒绝域在数据分布的两侧还是单侧来区分的,若是双侧检验,代表研究者不确定数据均值是高于检验值还是低于检验值,比如你的数据,如果你不清楚后测数据是否高于前测数据,就想知道前后测的均值是否不同,那就用双侧检验;如果你仅仅想知道后测是不是高于前测,或者仅仅想知道前测是不是低于后测,那可以用单侧检验,因为此时你只关心某一侧的拒绝域,对另一侧不感兴趣。
简单来说,双侧检验只能证明你比较的两个项目之间是有差异的,但是不能告诉你这两组中哪个高哪个低;单侧检验就可以告诉你是低于还是高于。从原假设来判断的话:双侧的原假设用的是a≠a0单侧检验的假设是a>a0或者a
参数检验:t检验 t.test()
https://zhuanlan.zhihu.com/p/360185346
当前各类期刊对于实验的生物学重复都有一定的要求,因此适用于两样本比较的卡方检验出现频率逐渐减少,T检验常用于两组数据比较,成为当前期刊文章中出现频率最高的检验类型,T检验根据检验的数据类型又可以分为3种:
1)单样本T检验 :较少被使用。检验单组样本的平均值是否等于目标值,如:某个班级学生的平均身高是否达到全国平均身高等。
单样本均值t检验,用于判断样本均值与已知的标准是否具有显著差异,如判断一个球队队员的平均身高是否与 190cm 有显著差异
例子:https://mp.weixin.qq.com/s/4q9eHe48eljHPq0KeloVvw
2)独立样本T检验:最常被使用,检验两组独立样本的平均值之差是否等于目标值,如:疾病组与健康组的某项指标是否存在显著差异等。
两个相互独立的样本,如果均服从正态分布,且方差无显著差异(方差齐次),可以使用 t 检验,比较两样本的均值是否具有显著差异
例子:https://mp.weixin.qq.com/s/37Y90UsoXWpNfGfLoYt-jQ
3)配对T检验:偶尔被使用,检验相关或配对观测之差的平均值是否等于目标值,例如:检验一款减肥药效果,同一个人服药前后的体重数据就是配对的数值,检验若干个配对的体重数值是否存在显著差异。
参数检验:方差分析 aov()或anova()
方差分析(Analysis of Variance,简称ANOVA),又称“变异数分析”,F检验,是R.A.Fisher费舍尔发明的,用于两个及两个以上样本均值差别的显著性检验。
当因变量的分布不满足方差齐性的要求时,也可采用FWelch检验。但论文中一般直接用非参数检验,更为稳健。
概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。
非参数检验:Wilcoxon 秩和检验 wilcox.test()
单样本wilcoxon test:在对单样本进行 t 检验时,如果样本的分布未能通过正态性检验,通常需要采用非参数的 wilcoxon signed rank test,检验样本的中位数与预设指标间的差异是否具有显著性。
单样本wilcoxon test 例子:https://mp.weixin.qq.com/s/x9cg8MiJFcZlpoyRLEc1oQ
Wilcoxon test (Mann-Whitney U test) 检验两独立 非正态样本中位数差异的显著性
两独立非正态样本wilcoxon test 例子:https://mp.weixin.qq.com/s/Bj2M4zD3U4WGaGV9IbBYYw
正态性检验:R 的 shapiro.test() 或者 nortest 包 ad.test() 函数分别检验两组数据是否服从整体分布, 若均小于0.05, 即两组样本均不服从正态分布。
wilcoxon test:数据不满足正态性假设,因此不能使用 t test, 应该使用非参数的wilcoxon test。 p 值小于0.05,则两组样本间具有显著差异。
* 代表p值小于0.05,**代表p值小于0.01,*** 代表p值小于0.001。ns代表组间无差异
非参数检验:Kruskal-Wallis 检验,KW秩和检验 kruskal.test()
克鲁斯卡尔-沃利斯检验(Kruskal-Wallis test)亦称“K-W检验”、“H检验”等。用以检验两个以上样本是否来自同一个概率分布的一种非参数方法。被检验的几个样本必须是独立的或不相关的。与此检验对等的参数检验是单因素方差分析,但与之不同的是,K-W检验不假设样本来自正态分布。它的原假设是各样本服从的概率分布具有相同的中位数,原假设被拒绝意味着至少一个样本的概率分布的中位数不同于其他样本。此检验并未识别出这些差异发生在哪些样本之间以及差异的大小
多组数据非参数检验kruskal test 例子:https://mp.weixin.qq.com/s/FujhL2tYwJaiZZ2C3_dE-Q
分别对n组数据(n应该是大于2)进行正态性检验,p 值均小于 0.05,即均不服从正态分布。接着使用 Kruskal-Wallis test 进行方差分析,结果显示 p<0.05,说明至少有一组数据与其他组数据存在显著差异。
可以接着使用 pairwise.wilcox.test() 函数(图基(Tukey)检验),进行组间两两之间分别比较,结果可显示任意两组间的 p 值是否小于0.05,若小于说明两组数据间具有显著差异。(三组以上数据比较(KW秩和检验时),配合使用多重比较检验,获得两两分组间的差异结果)
非参数检验:卡方分布
https://www.jianshu.com/p/8e8ab8b47c7d
文献中如此描述卡方检验的应用:”卡方检验用来比较试验组和控制组在A、B中的分布差异“。其中:A将定性变量分为性别(男性、女性)、年龄段(18-35、35-55、55以上)、是否吸烟(吸烟、不吸烟、以前吸烟)。B将定性变量分为移植物长度(6毫米、8毫米、9毫米)
以上性别、年龄段、移植物长度变量均可视为分类变量,根据这些变量进行分类。p值大于0.05,反映出变量在试验组和控制组间无显著差异。即变量的分布与是否分在试验组还是控制组无关、相互独立。卡方统计量的值越大,对应的P值越小。
多重比较(多重检验)
当总体检验有统计学意义后,接下来我们会想知道哪两个组间会存在差异,就涉及到两两比较(或者叫多重比较)。参数检验和非参数检验都有多重比较。以参数检验为例,多重比较(multiple comparisons)是指方差分析后对各样本平均数间是否有显著差异的假设检验的统称。方差分析只能判断各总体平均数间是否有差异,多重比较可用来进一步确定哪两个平均数间有差异,哪两个平均数间没有差异。
比较方法有 N-K(Newman-Keuls)检验、邓肯(DunCan)检验、图基(Tukey)检验、邓尼特(Dunnett)检验、Dunn 检验、最小显著差检验以及谢费(Scheffé)检验等它们的理论依据和应用条件都有所不同。R包PMCMR(The Pairwise Multiple Comparison of Mean Ranks Package) 提供了大量的秩和检验(包括Kruskal Wallis、Friedman)后的多重比较方法。直接利用ggstatsplot包进行数据统计检验分析和呈图更爽的。
与Wilcoxon检验相比,Dunn检验考虑了Kruskal-Wallis测试所使用的rank。还对tie(数据中存在相同的数值)进行了校正。
统计学学习优秀博主笔记
http://rvdsd.top/categories/%E7%94%9F%E7%89%A9%E7%BB%9F%E8%AE%A1/
Pearson 和 Spearman 相关系数
https://mp.weixin.qq.com/s/0nwiXEHgXUXbEMtZZ4xq7w
pearson 和spearman 相关系数,用于分析两连续变量之间的相关性。
pearson 相关系数是基于原始数据的,用于衡量两变量之间的线性关系;spearman 相关系数基于排序,用于衡量单调关系。
pearson 相关系数 正态分布
pearson 相关系数相关系数的取值范围为 [-1,1],1 表示强正相关,0 表示没有相关性,-1 表示强负相关。变量服从正态分布是应用pearson相关系数的前提,p 值大于0.05,则变量的分布与正态分布无显著差异,可以计算pearson 相关系数。
cor() 函数用于计算相关系数,参数 x 和 y 分别指定两个变量,method 用于指定相关系数的类型;cor.test() 函数不仅能够计算相关系数,还能够显示相关系数结果的显著性,如算出为负值且p<0.05,即呈显著负相关。
Spearman 相关系数 非正态分布
当数据不能通过正态性检验时,可以考虑使用spearman相关系数,spearman 相关系数的取值范围为 [-1,1],1 表示强正相关,0 表示没有相关性,-1 表示强负相关。