目录
概率论学习自述
概率论的一些基本概念
随机变量的分布
一维随机变量的分布
二维随机变量
抽样分布
数学期望
矩
方差
协方差
常见分布的数学期望与方差:
一些重要的定理公式
参数估计
(1)点估计
(2)区间估计
假设检验
独立性
所学概率论与数理统计属于大学的一门课程,通过数学方法来解释现实生活中的规律性。主要针对随机变量开展研究。对随机变量的分布,数字特征(数学期望,方差,协方差,矩...)进行研究并依据概率论中的一些基本定理可以通过样本对统计参数进行估计和检验。
随机试验:1.可重复进行2.各个结果已知不止一个且无法确定试验出现结果
样本空间:所有可能结果组成的集合
随机事件:一些结果(样本点)的集合
频率与概率:频率在试验趋于无穷时等于概率。概率具有1.非负性2.可列可加性
独立性:两事件的发生相互不影响称为二者独立
古典概型:又称为等可能概型。1.样本点有限2.每个基本事件出现的概率相同
随机变量:对事件发生的各个结果联系数字进行定义,创造出一个随着结果不同而变化的实值单值函数就是随机变量
分布函数和概率密度:分布函数和分布率体现出随机变量取不同值时的概率,概率密度体现出随机变量取值的密集成程度
统计量:随机变量的函数
抽样分布:统计量的分布即为抽样分布
离散型:
相互独立的X~B(n1,p),Y~B(n2,p),X+Y~b(n1+n2),证明见下面附页。
三者之间的关系,多个0-1分布组合成二项分布随机变量。
当λ=np时(即n很大,p很小)可以将二项分布近似成泊松分布。
除此之外,在使用这个公式时要注意k不能过大
连续型:
(1)正态分布 概率密度: ,
且相互独立,则,
分布函数: F(x,y)=P(X≤x,Y≤y) 分布律:按P(X=x.Y=y)展开
运算特点与性质:
1.P(a 2.F(-∞,y)=F(x,-∞)=0;F(∞,∞)=1 概率密度: f(x,y)满足 二维随机变量函数的分布: (4) Z=MAX{X,Y}与Z=MIN{X,Y} 推导过程描述:(1)(2)(3)在X,Y独立的基础上得到f(x,y),确定积分区域,写出对x,y的积分后用z进行换元得到结果。也可能直接有f(x,y) (4)主要依靠独立和包含关系推导。 三个常用统计量的分布: (1)χ²分布 性质:可加性 图像: 性质: 图像: 一些重要统计量的分布 (5)其中 离散型公式: k阶原点矩: k阶中心矩: 公式: 计算性质:1. +2COV(X,Y) 2. 3. 协方差公式:1. 2. 计算性质: 1. 2. 3. (3) E(X)= (4) E(X)=p D(X)=p(1-p) (5) E(X)=np D(X)=np(1-p) (6) E(X)=λ D(X)=λ (7) E(X)=n D(X)=2n (2)乘法定理: (3)全概率公式: 易记错:全概率公式的项是P(A|B)P(B)形式,不是P(A|B) 用处:用于粗略估计随机变量范围概率 (2)大数定律:描述一些随机变量的项的算数平均值收敛到这些项的均值 弱大数定律(辛钦大数定律): 中心极限定理:大量随机因素(变量)共同作用下(构成统计量)的分布近似于正态分布 (1)独立同分布的中心极限定理 (2)李雅普诺夫定理(省去同分布,复杂标准化变量) (3)棣莫弗-拉普拉斯定理(针对二项分布,视为0-1分布之和) :总体之中有未知参数需要通过样本值进行估计 常用构造矩估计量即样本矩,代入样本均值求解矩估计值得参数 最大似然估计:基于θ的取值应使得在θ范围内取得较大值,认为使连乘取最大值的估计合理。 为了计算简便,可以对连乘函数进行取对数再求导求出θ的取值。 最大似然估计的不变性:有,也有时 有估计值使连乘函数取最大值,也有使连乘函数取最大值,就可以说是μ的最大似然估计。 原理简述:本质依然是通过样本估计未知参数,构造枢轴量(不依赖未知参数确定分布类型的统计量) ,通过取枢轴量的概率区间,例如结合所要用到的样本涵义是:样本值的算数平均值有(1-α)的可能在区间内,变换上面式子有,涵义是取得样本的算数平均值构成区间有(1-α)的可能包括μ,即μ有(1-α)的可能在在取得样本的算数平均值构成的区间内,把称为置信区间,1-α称为置信水平。 单正态总体枢轴量: 已知σ,估计 ~N(0,1) 。未知σ,估计 ~t(n-1) 双正态总体枢轴量: 0-1分布枢轴量: 当n足够大时,由中心极限定理近似得, 单侧置信区间: 书写概率区间不等式时,只列需要的一侧。 检验原理:对于,在假设成立的条件下,得到较大的置信水平的置信区间,若样本值使枢轴量落在这个区间内就接受,并称这个区间为接受域,反之,落在这个区间之外,则这个区间之外的区间就是拒绝域。 要注意的是对换原假设和备择假设可能得出接受域有重合,但是只要样本足够大,必定会有一方落在拒绝域一方落在接受域内。 第一类错误:即为真而认为其为假的概率α 第二类错误:α越大其越小 检验统计量可以用区间估计枢轴量 双边假设检验,类型;右边检验:类型;左边检验:. A,B相互独立; A,B相互独立; A,B相互独立; A,B相互独立E(AB)=E(A)E(B); A,B相互独立; 若(A,B)为二维正态分布且A,B相互独立。 概率考试一些常见题型: 这种题设计到概率与集合之间的运算: 主要考察条件概率公式,概率独立性公式,概率中集合关系就会有加法公式P(A+B)=P(A)+P(B)-P(AB)和减法公式P(A-B)=P(A)-P(AB),还可能涉及全概率公式: 2. 这题主要考察古典概型的求解。在这里需要求解问题就需要对问题的可能性进行划分,那么以不同的方式划分就有不同的求解过程,就有盒子是否不同,球是否不同的看法区别。而我认为主要有以下过程: 1分析问题,确定问题的全部可能,并且用若有限给出个数2仔细辨别基本事件,即代表1的可能是以什么条件出现的(这就是确定盒子,球同不同)3为所求问题以这种认识道德最低划分来计算个数。 当问题的可能是无限多个却又等可能时,称其为几何概型,顾名思义解题的时候一般要结合画的图求解。 求随机变量函数的概率密度:就是将转化成再转化成这样就能把Y的分布函数反应到X的分布函数上,再进行求导就是g(x)的概率密度了。 当碰到Z=g(x,y)时有以下步骤: 1求出(x,y)的概率密度,往往有独立可直接得 2通过Z=g(x,y)<=z画出积分区域进行积分即可 这种题型在考察边际密度条件概率这种基本知识的深入了解应用: 第一问,求而不是这是应为x,y相互牵制,要求边际密度则默认y不受x影响,x受y影响,前者就相当于在形式上解除X的牵制。 第二问中条件概率展开后的原因是画出图来发现区域的限制对这个点并无影响。 对于这种题,求COV,D(Z),抑或者是数学期望E(Z)和相关系数的都主要考察他们的公式。 从COV来看,1可以将Z=2X-Y代入后再展开到多个COV。2有时求3有时则根据相关系数和方差根据公式求 从COV的第2中可能又需要求期望,而有些期望需要根据Z=g(x): Z=g(x,y): 来求,这就涉及积分运算 6. 极大似然估计无偏性问题:1建立极大似然估计函数2视情况取对数再求导3当可等于零,求出位置参数估计量。不能等于零,根据题意求出适合的估计量使估计函数最大 无偏性:即是在独立同分布条件下有相同的均值下,求未知参数取数学期望后再依据此去对总体X求位置参数的之,二者相等,无偏。 对于矩估计,则是通过求解E()得方程组求解未知参数 8. 对于假设检验类的题目,需要记住核心,检验,就是通过去检验,检验,就是通过S去检验(例如检验H0:的拒绝域构造形式是),在之后是相关统计量,上面原理总结已经述说。 这题较特殊Z=max{X,Y}的数学期望难算,所以使用max{X,Y}=求解 这题涉及到使用0-1分布,10人每人获得金币的概率相同,转化成0-1分布就可以更好的求解X的数学期望。 附页: 相互独立的X~B(n1,p),Y~B(n2,p),X+Y~b(n1+n2): 抽样分布
数学期望
矩
方差
协方差
常见分布的数学期望与方差:
一些重要的定理公式
参数估计
(1)点估计
矩估计:用样本均值估计总体均值解算出相关未知参数,未知参数包含于总体均值中。(2)区间估计
假设检验
独立性: