统计学(第七版)贾俊平 学习笔记__第一章 导论

1.1统计学及其应用

1.1.1 什么是统计学

1.统计学的概念:

    统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。

    数据收集:取得统计数据;

    数据处理:将数据用图表等形式展示出来;

    数据分析:选择适当的统计方法研究数据,并从数据中提取有用的信息进而得出结论。

2.数据分析的方法:

    分为描述统计方法和推断统计方法。     

 (1)描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法;可以拿到全部数据的分析方法。

 (2)推断统计是研究如何利用样本数据来推断总计特性的统计方法;无法拿到全体数据的分析方法。

1.1.2 统计学的应用领域

   数据分析的真正目的是从数据中找出规律,从数据中寻找启发,而不是寻找支持;真正的数据分析事先没有结论,通过对数据的分析才能得出结论。

1.2 统计数据的类型

1.2.1 按照采用的计量尺度

   按照采用的计量尺度的不同,可以分为:分类数据、顺序数据、数值型数据。

(1) 分类数据:只能归于某一类别的非数字型数据,是对事物进行分类的结果,数据表现为类别,是用文字来描述;比如性别,企业行业。

(2)顺序数据:只能归于某一有序类别的非数字型数据;比如:产品等级,成绩成绩,同样也可以用数字表示等级,1满意,2比较满意,3不满意。

(3)数值型数据:按照数据尺度去测量的观察值,表现结果为具体的数值。

分类数据和顺序数据说明的是事物的品质特征,通常用文字来描述,其结果均表现为类别,因而也可以统称为定性数据或者品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现,因此也可以成为定量数据或数值数据。

1.2.2 按照统计数据的收集方法

本质:是否有控制得到的数据。

观察数据:通过调查或观测得到的数据,在没有事物人为控制的条件下得到的。

实验数据:在实验中控制实验对象收集到的数据。

1.2.3 按照被描述的现象与时间的关系

本质:截面数据是相同时间不同空间的数据;时间顺序数据:不同时间,相同空间的数据。

截面数据:在相同或者近似相同点收集的数据,这类数据通常是在不同的空间获得的,用于描述现象在某一时刻的变化情况。

时间序列数据:在不同的时间收集到的数据,这类数据是按时间顺序收集到的,用于描述现象随时间的变化情况。

1.3 统计中的几个基本的概念

本质:参数是总体的度量;统计量是样本的度量。

1.3.1 总体与样本

  总体:包含所研究个体(数据)的集合。分为有限总体和无限总体。

  样本:是从总体中抽取一部分元素的集合。

1.3.2 参数与统计量

  参数:是用来描述总体特征的概括性数字度量。

  统计量:用来描述样本特征的概括性数字度量。

1.3.3 变量

 说明现象某种特征的概念,其特点是从一次观察到下一次观察结果会呈现出差别或变化。

分类变量,顺序变量,数值型变量;数据取值为1.2.1。

 

你可能感兴趣的:(统计学)