数理统计是具有广泛应用的一个数学分支,它以概率论为理论基础,根据试验或观察得到的数据,来研究随机现象,对研究对象的客观规律性作出合理的估计和判断。
概率论与数理统计的区别:
概率论所研究的随机变量,其分布都是假设已知的,在这个前提下研究其性质、特点和规律性。
数理统计所研究的随机变量,其分布是未知或不完全知道的。需要通过独立重复的观察并对观察数据进行分析,来推断其分布。
数理统计方法具有“部分推断整体”的特征 .
基础概念:概率论中,对随机现象的观测叫做随机试验。随机变量(random variable)表示随机现象(在一定条件下,并不总是出现相同结果的现象称为随机现象)各种结果的实值函数(一切可能的样本点)。例如某一时间内公共汽车站等车乘客人数,电话交换台在一定时间内收到的呼叫次数等等,都是随机变量的实例。
总体和样本
数理统计中,将研究对象的全体称为总体,构成总体的每个成员称为个体,总体中所包含的个体的个数称为总体的容量。
实际问题中,人们关注的往往是每个成员的某种指标,而不是每个成员的种种具体特性。
例如:我们要研究北京市中学生的身高和体重分布情况,若把北京市全体中学生看做总体则没有抓住事物本质,我们真正的研究对象是该市中学生的身高和体重这两个数量指标。
因而,我们通常把个体所具有的数量指标的全体作为总体,个体即为每一个成员的数量指标,总体中所包含的个体的个数称为总体的容量。
研究灯泡的使用寿命问题灯泡的使用寿命在观测前只知道其一切的可能取值,并不能确定其具体取值,因而我们用随机变量X去描述总体,简称总体X 。
若被研究的对象的数量指标不止一个,不妨设为k个,则他们构成k维向量,称为k维总体,上面例子中的北京市中学生的身高和体重是二维总体。
样本
从总体中抽取的待测个体组成的集合称为样本。样本所含的个体数目称为样本容量。
例如:从国产轿车中抽5辆进行耗油量试验,样本容量为5,抽到哪5辆是随机的。
n称为这个样本的容量。
一旦取定一组样本X1, … ,Xn ,得到n个具体的数 (x1,x2,…,xn),称为样本的一次观察值,简称样本值 。
最常用的一种抽样叫作“简单随机抽样”,其特点:
1. 代表性: X1,X2,…,Xn中每一个与所考察的总体有 相同的分布。
2. 独立性: X1,X2,…,Xn是相互独立的随机变量。
总体、样本、样本值的关系
例如:考察某大学一年级2000名男生的身高
总体:2000名男生身高的所有可能值。等价于某个随机变量X。
样本:例如抽取10名男生,则这10名男生的身高可能值为一个样本。可表示为随机变量X1, … ,X10。
样本值:这10名男生的身高测量值,记为x1,…,x10。