一个学科如果连定量都做不到一定是不成熟的。生物、医学、经济、金融、国防等社会生活的各个方面都需要数学来量化,任何一个体系运行的好坏都要通过数据来检验,现代科技的发展更是把改进技术指标的关键变成了统计问题。—— 范剑青
应用案例:
统计学是用数据的方式给大家讲故事,使我们了解身边正在发生了什么,事物间的关系,帮助我们解决存在的问题。
统计使人豁达,见怪不怪!
自然现象和社会经济现象的数量方面
(核心内容)
变异是统计学存在的基础。
绝对数
相对数和平均数
统计指标与标志既有区别又有联系。 主要区别在于:统计指标是说明总体特征的,而标志是说明总体单位特征的。统计指标分为数量指标和质量指标,它们都可以用数量来表示;而标志分为数量标志和品质标志,数量标志可以用数量来表示,但品质标志只能用文字表示。 二者的密切联系:有许多指标的数值是从总体单位数量标志的标志值汇总而来的。
按照统计任务的要求,运用科学的调查方法,有组织地搜集统计资料的工作过程。
统计调查决定了整个统计工作的质量。
按调查对象的范围分:
按调查时间的连续性分为:
按组织形式分为:
确定调查的目的
确定调查项目
制定调查的组织实施计划
是国家为详尽了解某项重要的国情国力而专门组织的一次性全面调查。
重点单位
:这些单位的单位数在总体中占的比重很小,而标志总量占的比重很大。
先对总体进行分析,然后选择有代表性的单位进行非全面调查。
特点:
几种抽样调查的形式:
抽样、重点、典型调查区别:
(1)样本选取不同
抽样调查
中的调查单位是按随机原则从全部总体单位中抽选出来的,不受人的主观因素所影响。重点调查
是选择一部分重点单位作为样本,且重点单位标志总量全部单位标志总量的绝大比重。典型调查
中的典型单位是在对总体情况分析的基础上有意识的抽选出来的。(2)调查目的不同
抽样调查
的目的,是以样本量来推断总体的数量特征;重点调查
的目的,是为了掌握现象总体的基本情况;典型调查
的目的,为了研究现象总体出现的新情况、新问题而进行的深入细致的调查。(3)推断总体的可靠程度不同
抽样调查
可以计算和控制推断的可靠程度。重点调查
不能推断总体总量;典型调查中
一定条件下可以推断总体总量,但又不知道可靠程度;统计报表是按国家统一规定的表式、统一的指标项目、统一的报送时间,自下而上定期提供统计资料的一种报告制度。
项目类型 | 普查 | 抽样调查 | 重点调查 | 典型调查 | 统计报表 |
---|---|---|---|---|---|
调查范围 | 全面 | 非全面 | 非全面 | 非全面 | 全面或非全面 |
调查时间 | 一次性 | 经常性或一次性 | 经常性或一次性 | 一次性 | 经常性 |
组织形式 | 专门调查 | 专门调查 | 报表制度或专门调查 | 专门调查 | 报表制度 |
调查单位的选择 | — | 按随机原则抽取样本单位 | 标志值在总体标志总量中占绝大比重的单位 | 具有典型代表的单位 | — |
调查结果能否推算总体 | — | 能 | 否 | 一般不能,但在划类选典和对准确性要求不高时也可以 | — |
统计整理的概念
根据统计研究的目的,对调查所得的原始资料进行科学的分类和汇总,为统计分析提供系统化、条理化资料的工作过程。
它是统计调查的继续和深化,又是统计分析的基础和前提。
统计整理的具体步骤
统计整理最重要的环节之一是统计分组。
统计分组:根据现象的特点和统计研究的目的要求,按照某个(或几个)标志把总体划分为若干不同性质的组。
统计分组的作用:
分组原则:
选择分组标志:
在统计分组的基础上,将总体所有的单位按某一标志进行归类排列。各组的单位数为频数,各组单位与总体单位总数之比叫频率。 将这些排列形成的表称为分配数列。
上组限不计入
显示方法:
曲线类型:
钟型分布
特征是“两头小,中间大”,即靠近中间的变量值分布的次数多,靠近两边的变量值分布的次数少,其曲线图宛如一口钟。
如:正态分布
U型分布
U型分布的形状与钟型分布相反,靠近中间的变量值分布次数少,靠近两端的变量值分布次数多,形成“两头大,中间小”的U型分布。
如:人口死亡率分布(幼儿和老人死亡率高,而中青年死亡率低)
总量指标是反映一定时间、地点和条件下某种现象总体规模或水平的统计指标。它的表现形式是绝对数。
总量指标的作用:
(1)按说明总体的内容不同分为:
总体单位总量
—— 是用来反映统计总体内包含总体单位个数多少的总量指标。它用来表明统计总体的容量大小。总体标志总量
—— 是统计总体各单位某一方面数量标志值的总和。(2)按反映总体的时间状况不同分:
时期指标
—— 是反映社会经济现象在一段时间上发展变化结果的总量。
时点指标
—— 反映社会经济现象在某一时刻或某一时点上的状况的总量。
相对指标是说明现象之间数量对比关系的指标,用两个或两个以上有联系的指标数值对比来求得,其结果表现为相对数。
相对指标是说明现象之间数量对比关系的指标,用两个或两个以上有联系的指标数值对比来求得,其结果表现为相对数。
相对指标的作用:
(一) 结构相对指标
反映总体内部结构的一种综合指标。一般用百分数、成数或系数表示。
(四) 动态相对指标
将同—现象在不同时期的两个数值进行动态对比而得出的相对数,借以表明现象在时间上发展变动的程度。—般用百分数或倍数表示,也称为发展速度。
(五) 强度相对指标
在同一地区或单位内,两个性质不同而有一定联系的总量指标数值对比得出的相对数,是用来分析不同事物之间的数量对比关系,表明现象的强度、密度和普遍程度的综合指标。
(六) 计划完成情况相对指标
计划完成程度相对指标是社会经济现象在某时期内实际完成数值与计划任务数值对比的结果,一般用百分数来表示。
计划数为绝对数和平均数时
使用绝对数和平均数计算计划完成程度相对指标时,可直接用上述计算公式。
计划执行进度相对数
计划执行进度相对数=计划期期初至某时间止累计完成数/全期计划任务数×100%
长期计划完成相对数(水平法时点)
长期计划中只规定最后一年应达到的水平,若连续累计12个月实际完成数达到计划规定最末一年的水平,则剩余时间为提前完成计划的时间。
长期计划完成相对数=长期计划末实际达到的水平/长期计划规定的末年水平
长期计划完成相对数(累计法)
长期计划完成相对数=长期计划期间实际累计完成数/长期计划规定任务数
平均指标是总体各单位标志值在一定时间、地点条件下所达到的一般水平。
平均指标是衡量集中趋势的指标
平均指标作用:
总体标志总量与总体单位总量的值。
分子分母为同一总体,分母是分子的承担者
条件:掌握了没有分组的总体各单位的标志值或已经有了标志总量和总体总量的资料。
条件:分组资料
特点:平均数的大小既受其变量值大小的影响,又受其次数多少的影响
注意公式变形
简单算术平均数与加权算术平均数的联系:
如果各组权数相同,权数就失去了权衡轻重的影响作用,加权算术平均数就变成了简单算术平均数。
也称为倒数平均数。各变量值的倒数(1/Xi)的算术平均数的倒数。
n项标志值连乘积的n次方根。
适用于计算平均比率或平均速度。
算术平均数、调和平均数和几何平均数,统称为数值平均数,它们是所有变量值参加代数运算的结果,都要受到极端值大小的影响。算术平均数最容易受其影响,且受极大值的影响要大于受极小值的影响;调和平均数受极小值的影响要大于受极大值的影响;几何平均数受极端值的影响程度比前两者都小。因此,对同一资料计算这三种平均数,所得到的指标数值关系为:
将总体各单位按其标志值的大小顺序排列,处于数列中间位置的变量值。
特点:
中位数是一个位置代表值
,利用中位数分析数据可以获得一些信息。有一半数比中位数大,有一半数比中位数小。即小于或大于这个中位数的数据各占一半。
中位数确定方法
未分组资料
单项式分组的资料
组距分组的资料
总体中最普遍出现的变量值
特点:
组距变量数列计算 (采用插补法)
指标 | 极端值影响 | 适用情况 | 其他特性 |
---|---|---|---|
平均数 | 易受极端值影响 | 数据对称分布或接近对称分布时代表性较好 | 数学性质优良,实际中最常用 |
中位数 | 不受极端值影响 | 数据分布偏斜程度较大时代表性较好 | — |
众数 | 不受极端值影响 | 数据分布偏斜程度较大且有明显峰值时代表性较好 | 具有不惟一性 |