分组数据方差公式_数据分析入门:必须掌握的15个统计学公式

分组数据方差公式_数据分析入门:必须掌握的15个统计学公式_第1张图片

算数平均数

通过算术平均数,可以求出一定观察期内预测目标的时间数列的算术平均数,以作为下期预测值。

0a8fd1f52d3c26ca3f1483955b9812d2.png

调和平均数

调和平均数又称倒数平均数,是变量倒数的算术平均数的倒数。

(1)简单平均式

9acd5f0e12b0383bc682f469ecad5ffc.png

(2)加权平均式

b674dbb032413f26e6322b4ca3442750.png

几何平均数

几何平均数多用于计算平均比率和平均速度。

(1) 简单几何平均法

426fdc3c835654a06b3b2e71a88f2ac3.png

(2) 加权几何平均法

eef639009a4689592db96e85cdcd90c0.png

众数

众数是指社会经济现象中最普遍出现的标志值。从分布角度看,众数是具有明显集中趋势的数值。

fc00ecec929aa6a9e6757d3d9b90cb88.png
9255e7cb61275efbb884cac4ed0a9c9a.png

L——众数所在组下限;

U——众数所在组上限;

▲1——众数所在组次数与其下限的邻组次数之差;

▲2——众数所在组次数与其上限的邻组次数之差;

d——众数所在组组距。

中位数

中位数是指将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数据。 在数列中出现了极端变量值的情况下,用中位数作为代表值要比用算术平均数更好,因为中位数不受极端变量值的影响。

分组数据方差公式_数据分析入门:必须掌握的15个统计学公式_第2张图片

极差

极差是指总体各单位的两个极端标志值之差。

R=最大标志值-最小标志值

四分位差

四分位差是指将各个变量值按大小顺序排列,然后将此数列分成四等份,所得第三个四分位上的值与第一个四分位上的值的差。主要用于测度顺序数据的离散程度。

Q = Q3 − Q1

其中:Q1的位置=(n+1)/4

Q3的位置=3(n+1)/4

方差/标准差

方差和标准差也是根据全部数据计算的,它反映了每个数据与其均值相比平均相差的数值,因此它能准确地反映出数据的离散程度。

设总体方差为σ2,对于未经分组整理的原始数据,方差的计算公式为:

993f074b8e2ff495f5cff38b8176b43f.png

对于分组数据,方差的计算公式为:

68295ac2b839f518e7d3d30f96f87867.png

方差的平方根即为标准差,其相应的计算公式为:

(1) 未分组数据

f62181a7ba7beb9fb5d84bc91f81b5d7.png

(2) 分组数据

7b7d5d2fe6edb7ad7bfb2661bbf99cfc.png

平均差

平均差是总体各单位标志对其算术平均数的离差绝对值的算术平均数。它综合反映了总体各单位标志值的变动程度。平均差越大,则表示标志变动度越大,反之则表示标志变动度越小。在资料未分组的情况下,平均差的计算公式为:

fbc86ec12467ce174a63183e9a6fc4f6.png

变异系数

变异系数又称“标准差率”,是衡量资料中各观测值变异程度的另一个统计量。当进行两个或多个资料变异程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。如果单位和(或)平均数不同时,比较其变异程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较。

2caced69a18cb2541915702703a15959.png

偏度

偏度是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。

2e80acb34ad15680741e93d6547781b5.png

Sk——偏度;

μ3——3阶中心矩;

σ——标准差。

在一般情形下,当统计数据为右偏分布时,Sk > 0,且Sk值越大,右偏程度越高;当统计数据为左偏分布时,Sk < 0,且Sk值越小,左偏程度越高。当统计数据为对称分布时,显然有Sk = 0。

峰度

峰度是指次数分布曲线顶峰的尖平程度,是次数分布的又一重要特征。统计上,常以正态分布曲线为标准,来观察比较某一次数分布曲线的顶端正党风尖顶或平顶以及尖平程度的大小。

6ea50afd1587706d646766b627b34de3.png

综合指数

综合指数的目的在于测定由不同度量单位的许多商品或产品所组成的复杂现象总体数量方面的总动态。综合指数包括数量指标指数和质量指标指数。

数量指标指数

(1)数量指标指数

A. 以基期价格(P0)为同度量因素的销售量总指数

d37a7088062e3a04465ab0bc2d293e9f.png

也称作拉斯贝尔数量指数公式

B. 以报告期价格(P1)为同度量因素的销售量总指数

29608b85105a9ab0008dd20928038c24.png

也称作派许数量指数公式。

C. 以特定期价格(Pn)为同度量因素的销售量总指数

646a90d2af42daf36bab46fade63c3b4.png

此公式的计算结果说明复杂现象总体数量指标综合变动的方向和程度

b46c38981b6213bfd45892f53acb952a.png

此差额说明由于数量指标的变动对价值量指标影响的绝对额。

(2) 质量指标指数

A. 以基期销售量(q0)为同度量因素的物价总指数

284c387e7e5fb8f4762294d479dfc979.png

也称作 拉斯贝尔物价指数公式

B. 以报告期销售量(q1)为同度量因素的物价总指数

e2303734ec76966a6e072abe53bdeb02.png

也称作 派许物价指数公式

C. 以特定期销售量(qn)为同度量因素的物价总指数

c4f58ec12808b7222b151d38696458d7.png

此公式的计算结果说明复杂现象总体质量指标综合变动的方向和程度。

f8265f429175c2d382156bd732478ea4.png

此差额说明由于质量指标的变动对价值量指标影响的绝对额。

加权平均数指数

加权的目的,是为了衡量不同商品价格(或物量)的变动对总指数造成的不同影响。加权平均数指数因权数所属时期的不同,分为基期总量加权指数和报告期总量加权指数以及固定权数加权指数。

(1)基期权数的算术平均数指数。

10adeb860bc160cc6cbeda265ff9a584.png
4c2ce000e630e27dff5ee4d10d70ca09.png

式中,p、q分别表示商品的价格和销售量;0、1分别表示基期和报告期;I表示总指数。

(2)固定权数的算术平均数指数。

aced95d4ab9b5c259baf484d37d79e5b.png
9e332293396f7fd340cebf5d0a1af609.png

上式中,W代表某一固定时期的权数。

加权调和平均数指数

加权调和平均数指数按采用权数形式的不同也可以分为两种:报告期权数的调和平均数指数和固定权数的调和平均数指数。

(1)报告期权数的调和平均数指数

363700f9c12040ebb326763ea382bbf7.png
9c89c624449df7e90e37b633fc58cc6e.png

(2)固定权数的调和平均数指数。这种加权调和平均数指数在实际工作中应用较少。

b42c054f8af6bf7b1fd671553e347467.png
4173ba64a095aa41c5de22e63bd7e50f.png

看到这里的同学,是不是很懵逼?放心好了,只要学统计学,这些公式都是绕不开的。

你可能感兴趣的:(分组数据方差公式)