附文件:http://zgw.100xuexi.com/SubItem/IndexInfoDetail.aspx?id=3f00a767-3f6f-4670-ad1e-5379db7d4b39
一、统计学
1统计学
统计学是收集、处理、分析、解释数据并从数据中得出结论的科学,其目的是探索数据内在的数量规律性。
数据收集是取得统计数据;数据处理是将数据用图表等形式展示出来;数据分析则是选择适当的统计方法研究数据,并从数据中提取有用信息进而得出结论。
2数据分析所用的方法
(1)描述统计:研究数据收集、处理、汇总、图表描述、概括与分析的统计方法;
(2)推断统计:研究如何利用样本资料来推断总体特征的统计方法。
3统计学的应用领域
(1)企业发展战略
(2)产品质量管理
(3)市场研究
(4)财务分析
(5)经济预测
(6)人力资源管理
二、统计数据的类型
1分类数据、顺序数据、数值型数据(按计量尺度不同分类)
(1)分类数据:只能归于某一类别的非数字型数据,是对事物进行分类的结果,数据表现为类别,一般用文字来表述;
(2)顺序数据:只能归于某一有序类别的非数字型数据,数据表现为类别,但类别有序;
(3)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。现实中所处理的大多数都是数值型数据。
关系:(1)分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因而也可统称为定性数据或称品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此也可称为定量数据或数量数据;(2)对不同类型的数据,可采用不同的统计方法来处理和分析。例如,对分类数据可以计算出各类别的频率,但对其进行加、减、乘或除等数学运算是没有意义的。而数值型数据则可以进行数学运算,比如计算均值和方差等统计量。
2观测数据和实验数据(按收集方法分类)
(1)观测数据:通过直接调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的;
(2)实验数据:在实验中控制实验对象以及所处的实验环境而收集到的数据。
3截面数据和时间序列数据(按被描述的现象与时间的关系分类)
(1)截面数据:又称为静态数据,它是指在同一时间对同一总体的数量进行观察而获得的数据,这类数据通常是在不同的空间上获得的,用于描述现象在某一时刻的变化情况;
(2)时间序列数据:又称为动态数据,它是指在不同时间对同一总体的数量表现进行观察而获得的数据,这类数据是按时间顺序收集到的,用于描述现象随时间变化的情况。
三、统计中的几个基本概念
1总体和样本
(1)总体
①总体、个体
总体是包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体组成。组成总体的每一个元素称为个体。
②总体的分类
根据总体所包含的单位数目是否可数可以分为:
a.有限总体:指总体的范围能够明确确定,而且元素的数目是有限可数的;
b.无限总体:指总体所包括的元素是无限的,不可数的。
(2)样本、样本量
①样本:从总体中抽取的部分单位组成的集合;
②样本量:构成样本的单位的数目。
2参数和统计量
(1)参数
参数是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。研究者所关心的参数通常有总体平均数、总体标准差、总体比例等,参数是一个未知的常数。
(2)统计量
统计量是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。研究者所关心的统计量主要有样本平均数、样本标准差、样本比例等,统计量不含任何未知的参数。
3变量
(1)变量、变量值
①变量:说明现象某种特征的概念,其特点是从一次观察到下一次观察结果会呈现出差别或变化,可以有两个或更多个可能的取值。
②变量值:变量的具体取值。
(2)变量的类型
①分类变量
是说明事物类别的一个名称,其取值是分类数据。
②顺序变量
是说明事物有序类别的一个名称,其取值是顺序数据。
③数值型变量
是说明事物数字特征的一个名称,其取值是数值型数据。根据其取值的不同,又可以分为:
a.离散型变量:只能取可数值的变量,它只能取有限个值,而且其取值都以整位数断开,可以一一列举;
b.连续型变量:可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举。
(3)变量的其他分类
①随机变量、非随机变量
②经验变量、理论变量
经验变量所描述的是周围环境中可以观察到的事物;理论变量是由统计学家用数学方法所构造出来的一些变量。