12.15 整理一点统计学知识

Assumptions 假设
Sample 样本

Parametric test 参数检验
normal distribution 正态分布

residuals 残差
http://blog.csdn.net/jmydream/article/details/8764869

在统计和最优参数选取时,统计误差以及残差是两个紧密相关,但同时又极易混淆的概念.两者都是对"样本值偏离均值"的测量. 样本误差是指样本对母本(无法观察到的)均值及真实值的均值的偏离. 残差则是指样本和观察值(样本总体)或回归值(拟合)的差额. 拟合值是统计模型的拟合结果,是依据拟合模型得出的.

homogeneity of variance方差齐性
histograms 柱状图

The normal distribution
-Bell shaped
-symmetrical around the centre

properties of frequency distributions
http://blog.sina.com.cn/s/blog_5eae53fb010188jp.html
-Skew偏度
--positive
--Negative

-Kurtosis丰度
--LeptoKurtic
--Platykurtic

峰度是描述总体中所有取值分布形态陡缓程度的统计量。这个统计量需要与正态分布相比较,峰度为0表示该总体数据分布与正态分布的陡缓程度相同;峰度大于0表示该总体数据分布与正态分布相比较为陡峭,为尖顶峰;峰度小于0表示该总体数据分布与正态分布相比较为平坦,为平顶峰。峰度的绝对值数值越大表示其分布形态的陡缓程度与正态分布的差异程度越大。

偏度与峰度类似,它也是描述数据分布形态的统计量,其描述的是某总体取值分布的对称性。这个统计量同样需要与正态分布相比较,偏度为0表示其数据分布形态与正态分布的偏斜程度相同;偏度大于0表示其数据分布形态与正态分布相比为正偏或右偏,即有一条长尾巴拖在右边,数据右端有较多的极端值;偏度小于0表示其数据分布形态与正态分布相比为负偏或左偏,即有一条长尾拖在左边,数据左端有较多的极端值。偏度的绝对值数值越大表示其分布形态的偏斜程度越大。

central tendency 集中趋势
bimodal
multimodal

Median 中位数
Mean 平均数

dispersion 离散
Range
the smallest score subtracted from the largest

Quartiles 四分位

四分位数(Quartile)是指在统计学中把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值。多应用于统计学中的箱线图绘制。

Quantiles 分位数
Percentiles 百分位数

Deviance 偏离程度

SS sum of squared errors 饿,我好想不会输入数学公式。。。

Variance 就是方差

Standard deviation 标准差

———————————————————————————————————

Z-scores
The distribution of z-scores has a mean of 0 and SD =1

标准分数也叫z分数,是一种具有相等单位的量数。它是将原始分数与团体的平均数之差除以标准差所得的商数,是以标准差为单位度量原始分数离开其平均数的分数之上多少个标准差,或是在平均数之下多少个标准差。它是一个抽象值,不受原始测量单位的影响,并可接受进一步的统计处理

这个百度了一下还蛮有意思的,可以比较不同单位的数据

———————————————————————————————————

Kolmogorov-Smirnov test
https://www.cnblogs.com/arkenstone/p/5496761.html
柯尔莫哥洛夫-斯米尔诺夫检验(Колмогоров-Смирнов检验)基于累计分布函数,用以检验两个经验分布是否不同或一个经验分布与另一个理想分布是否不同。

levene's testLevene方差齐性检验

Log transformation log 变换
Square root transformation 开根号变换
Reciprocal transformation 倒数变换

你可能感兴趣的:(12.15 整理一点统计学知识)