1 统计学
统计学可以分为:描述统计学与推断统计学
1)描述统计学:使用特定的数字或图表来体现数据的集中程度和离散程度。
2)推断统计学:根据样本数据推断总体数据特征。 例如:产品质量检查,抽检
2 集中趋势
通过均值 中位数 众数来考量数据的集中程度。
2.1 均值 : 算数平均数,描述平均水平
2.2 中位数 :将数据按大小排列后位于正中间的数,描述中等水平
中位数就是将数据按照大小顺序(从大到小或是从小到大都可以)排列后处于中间位置的数。当数据集是偶数个数时候,中位数是取中间两个数的平均数。
2.3 众数:数据中出现最多的数,描述一般水平
2.4 均值、中位数、众数的优缺点比较
3离散程度
3.1方差 variance
概念:
概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。
统计中的方差(样本方差)是每个样本值与全体样本值的平均数之差的平方值的平均数。
在许多实际问题中,研究方差即偏离程度有着重要意义。
下面找个例子来实际计算一个:
有一组样本数据 {6, 2, 9, 1, 2}
计算步骤如下:
(1) 样本的平均数是 (6+2+9+1+2 )/ 5 =4
(6 - 4)^2 + (2 - 4) ^2 + (9 - 4)^2 + (1 - 4)^2 + (2 - 4)^2
= 4 + 4 + 25 + 9 + 4(3) 46 / 4 = 11.5
3.2标准差 (standard deviation)
简单来说就是方差的开方