统计学的小知识

定距型数据(Scale)、定序型数据(Ordinal)、定类型数据(Nominal)

Mean(平均数):
数学定义: 一组数据的总和除以这组数据个数所得到


Geometry Mean(几何平均数):
数学定义:n个变量值连乘积的n次方根。


Median(中位数):
数学定义:将一组数据按大小顺序排列,处在最中间位置的一个数,左右各有50%数据


Mode(众数)
数学定义:在一组数据中出现次数最多的数叫做这组数据


Std. Deviation  标准差/标准偏差

Variance 方差   ,Variance=Std. Deviation X Std. Deviation

Range 极差 ,最大值-最小值

Chi-Square 方卡检测

Pearson Chi-Square 皮尔逊卡方值

对卡方值进行检验,如果卡方检验的结果不显著,则不能拒绝原假设,即两变量是相互独立、互不关联的,如果卡方检验的结果显著,则拒绝原假设,即两变量间存在某种关联,至于是如何关联的,这要看列联表中数据的分布形态。


Covariate 协变量

R Square 回归模型的解释程度,值一般在0到1之间,如果值为0.89,则说明你这个回归模型能解释89%的样本

t 统计值是用来判断参数的显著程度的,一般情况下T>2则说明这个参数显著,也就是说对模型的贡献量比较大,是不可以剔除的参数。

F 为F检验的值,F检验主要是解决方差分析,F=可以解释的误差(组间误差)/不能解释的误差(组内误差)
df1 为样本个数,df2 为变量个数
Sig 为F检验得出的p值

vif  方差膨胀因子(Variance Inflation Factor,VIF):是指解释变量之间存在多重共线性时的方差与不存在多重共线性时的方差之比。容忍度的倒数,VIF越大,显示共线性越严重。经验判断方法表明:当0<VIF<10,不存在多重共线性;当10≤VIF<100,存在较强的多重共线性;当VIF≥100,存在严重多重共线性


Bivariate Correlations 二元相关性

effect size 效应值

你可能感兴趣的:(统计学的小知识)