统计学中常用专用名词中英对照

最近接触了统计学的一些基础,由于看的资料是英文的,特意整理了部分专用名词的中英对照,以便理解。

英文 中文 备注
population 总体 N/A
sample 样本 N/A
population parameter(μ) 总体参数 可看作总体平均
sample statistics(x̄) 样本统计量 可看作样本平均1
sample error 误差 μ-x̄
X-aixs X轴 N/A
Y-aixs Y轴 N/A
origin 原点 N/A
odd number 奇数 N/A
even number 偶数 N/A
Cartesian coordinate 笛卡尔坐标 N/A
independent variable 自变量 N/A
predictor variable 预测变量 同自变量
dependent variable 因变量 N/A
outcome 结果 同因变量
lurking variable 潜在变量 N/A
extraneous factor 外界变量 N/A
histogram 直方图 X轴一般为numerical/quantitative
bar graph 柱形图 X轴一般为categorical/qualitative
bo plots/box and whisker plots 箱线图/盒须图 可以更好地表示IQR和四分位数
symmetrical 对称 N/A
uniform distribution 均匀分布 数据基本分布在同一水平
Bi-modal/Multimodal distribution 双峰分布 多个不同的mode
normal distribution 正态分布 高峰居中,左右大致对称
positively skewed distribution 正偏态分布 高峰左移,长尾右侧延长
negatively skewed distribution 负偏态分布 高峰右移,长尾左侧延长
mean 平均值 算术平均
median 中数 一组数据中的中间数值
mode 众数 一组数据中出现次数最多(peak)
rang 全距/极差 最大值与最小值的差2
midrange 中程数 最大值与最小值的平均数
deviation 偏差 样本(或总体)中数据与mean的差,
所有数据的偏差的和应为0
absolute deviation 绝对偏差 偏差的绝对值
squared deviation 平方偏差/平方差 偏差的平方
sum of squares(SS) 平方和 各个偏差平方的和
variance 方差 总体:偏差平方和除以n,SS/n
样本:偏差平方和除以n-1,SS/(n-1)
standard deviation(s/σ) 标准偏差 方差的平方根
first quartile(Q1) 第一四分位数 数据前50%的median
second quartile(Q2) 第二四分位数 median
third quartile (Q3) 第三四分位数 数据后50%的median3
interquartile range(IQR) 四分位距/四分差 Q3-Q1的值
outlier 离群值 与其他数据相比差距较大
小于Q1-1.5IQR或大于Q3+1.5*IQR
Bessel’s correction 贝塞尔校正系数 计算样本方差时除以n-1而不是n
z-score z值 (x-μ)/σ
probability density function(PDF) 概率密度函数 相对频率曲线,面积为1
negative infinity 负无穷 N/A
standard error(SE) 标准误差 σ/sqrt(n),标准偏差除以根号n
central limit theorem 中心极限定理 N/A
point estimate 点估计 N/A
margin of error 误差界限 (t or z)*σ/sqrt(n),置信区间的一半
confidence interval 置信区间4 z(x̄-z*σ/sqrt(n),x̄+z*σ/sqrt(n))
t(x̄-t*σ/sqrt(n),x̄+t*σ/sqrt(n))
critical region 临界区 alpha level
null hypothesis(H0) 零假设/虚无假设 N/A
alternative hypothesis(Ha) 对立假设/备择假设 N/A
one-tailed(directional) hypothesis 单尾(方向性)检验 N/A
two-tailed(non-directional) hypothesis 双尾(非方向)检验 N/A
Type I error I类错误 拒绝了正确的假设
Type II error II类错误 接受了错误的假设
t-statistic(student’s t) t统计量 点估计:(x̄-μ)/(s/sqrt(n))
相依样本:(μ1-μ2)/(s/sqrt(n))5
effective sample size 有效取样数 n-1
degrees of freedom 自由度 N/A
within subject design/repeated measures design 受试者内设计/重复衡量设计 N/A
between subject designs 受试者间设计 N/A
dependent sample t-test 相依样本t检验 N/A
independent sample 独立样本 N/A
longitudinal design 纵向设计 检验不同时间同一变量的变化
pretest posttest 预期检验,后期检验 检验更改前后同一变量的变化
effect size 效应量 处理(某种动作,措施等)效应的大小
difference measures 差异度量 均值差异
standardized difference 标准化差异度量 Cohen’s D
correlation measures 相关度量 r^2=t^2/(t^2+df)
statistical significance 统计显著性 N/A
pool variance 合并方差 (SSx+SSy)/(dfx+dfy)


小知识点:

  1. Measures of Central Tendency: Mean, Median, Mode
  2. Measures of Variability: Rang, IQR, Variance, Standard deviation
  3. 在统计学中有句话很流行: Correlation does not imply causation。
  4. 一般观察relationship可以通过observational studies survey,若要确认causation要通过controlled experiment。

以下为部分名词的介绍资料,供参考。


  1. 关于population, sample, parameter, statistics的详细说明可参考文章Populations, Samples, Parameters, and Statistics。 ↩
  2. 关于mean, median, mode, range的说明可参考文章Mean, Median, Mode, and Range。 ↩
  3. 关于Q1,Q2和Q3的说明,计算方式以及判断outlier的方法可参考维基百科Quartile。 ↩
  4. 关于置信区间的说明可参见知乎文章如何理解 95% 置信区间?中李大猫的说明,以及如何理解置信度?中邹日佳的解释。 ↩
  5. 关于t值和z值的区别以及使用可参考T-Score vs. Z-Score: What’s the Difference? ↩

你可能感兴趣的:(统计学/Statistics,统计学)