描述统计学

术语中英对照

自变量 :independent variable

因变量 :dependent variable

外在因素: extraneous factors

潜在变量:lurking variables

散点图:scatter spot

对照实验:a controlled experiment

调查问卷:survey

总体:population

抽像概念:constructs

对照组:comparison group

双盲测试:Double Blind

随机样本:random sample

群体参数:pupulation parameter

样本误差:sampling error

众数:mode

中位数:median

平均数:mean

均匀分布:uniform distribution

异常值:outlier

箱线图:boxplot

平均偏差:average deviation

方差:variance

标准偏差:standard deviation

抽样分布:sampling distribution

中心极限定理:central limit theorem

标准误差:standard error

抽样误差:sampling error

抽样分布:sampling distribution

频率表:frequency table

绝对数值:absolute number

类别:category

区间:interval

组距:binsize

直方图:histogram

柱状图:bar grath

正态分布:nomal distribution

英语充电:

这是1个非常重要的概念,我们要去深入理解它:Now this is a really important concept ,and we're going to try to drive this point home

相关并不代表因果:Correlation does not imply causation

硕士论文:masters thesis

远程进行:conducted remotely

有根据的猜测:enduated guess

一般来说:in general

小学:an elementary school

华氏72度: 72 degree Fahrenheit

在。。。拿不定主意:debating between

偏离基准不受很大影响:It's not affected much by departures from the norm

期末考试:final exam

提供数据如何分散的概要信息:provide a quick thumbnail picture of how spreed out data is

方便是有代价的:convenience comes out of price

初步了解:barely dipping our toes in the water

非常难的:this is very tricky

相互抵消:cancell each other out

受欢迎程度:Popularity Score

概率密度函数:Probability Density Function

术语定义

自变量:不受外界影响的变量

因变量:随自变量变化而变化的变量

例如:早睡,精神好,早睡晚睡即自变量,精神为因变量

外在变量:除了早睡,晚上吃的多不多也会影响第2天的精神,吃就是一个外在变量,在对照实验中,外在变量需要被控制

潜在变量与外在变量定义一致

双盲测试:观察者和被测试者都不知道自变量甚至因变量,只有研究人员才知道所有实情。例如在对照实验中,为了测试安眠药的睡眠效果,1组给真正的安眠药,1组给外观一致的安慰剂(无安眠效果),睡眠时间,睡眠地点等外在变量都控制一致,观察记录者只负责记录评分被测试者的睡眠,也不知道被测试者真正吃的什么药

直方图:

1.x 轴只能代表数值数据 ,不能代表类别数据

2.组距间没有间隙


描述统计学_第1张图片

柱状图:

x轴可以代表数值数据和类别数据


描述统计学_第2张图片

群体参数:μ、σ

众数:出现次数最高的值

中位数:位于中间的数,例如:奇数个 1234567,4是中位数,偶数个:123456  (3+4)/2=3.5, 3.5是中位数

平均数:求所有数的平均值

四分位差:IQR = Q3-Q1,将一组数字从小到大排列,并用中位数把这组数字,分成个数相同的两部分,分别算出前半部分的中位数记为Q1,后半部分的中位数记为Q3  例一组数字:4563217    按从小到大排列并以中位数分组: 123 | 4 | 567,那么,Q1=2,Q2=4,Q3=6

箱线图:用来图形化四分位差的一种图形


描述统计学_第3张图片

异常值计算公式:outlier < Q1-1.5(IQR) 或 outlier >Q3 +1.5(IQR)

方差计算公式:Σ(Xi-μ)^2/n

平均差:方差求根

所有的正态分布图都可以归一为标准正态公布图,通过计算Z值,查询Z值表,找到概率

Z值=(x-μ)/σ

中心极限定理:

1.样本标准误差:SE=σ/√n

2.样本均值分布的均值与总体平均值相等


你可能感兴趣的:(描述统计学)