事件的包含:
(1) A B : 事件A发生必导致事件B发生.
事件的相等
事件的积:
(3)A ∩B:事件A与B同时发生,简记AB;
互不相容事件(互斥事件):
(4): A与B不能同时发生.
事件的和(并)
(5) A ∪B:事件A与B至少有一个发生, 当 : A ∪B =A+B.
事件的差:
6)A -B:A发生而B不发生.
对立事件(逆事件)
7): 由A不发生所构成的事件.
事件的运算性质;
交换律: A ∪B=B∪A , AB=BA;
结合律:(A∪B)∪C=A∪( B∪C), (AB)C=A(BC);
分配律: (A∪B)C=(AC)∪(BC), (AB)∪C=(A∪C)(B∪C);
对偶原则(德—摩根律) :
概率:表示事件A发生可能性大小的 数值,称为事件A的概率,记为P(A);概率是随机事件的函数.
古典概率的定义:
若试验的样本空间S满足:
只有有限个样本点 — 有限性,
每个样本点发生的可能性相等 — 等可能性.
称此试验为古典概型试验.
古典概率的计算公式:
在古典概型下,事件A的概率定义为:
这里计算样本点数的主要工具是排列、组合.
加法原理
设完成一件事有m种方式
第一种方式有n1种方法,
第二种方式有n2种方法,
……
第m种方式有nm种方法,
则完成这件事总共有 n1 + n2 + … + nm 种方法 .
乘法原理
设完成一件事必须经过r个步骤,
第一个步骤有n1种方法,
第二个步骤有n2种方法,
第三个步骤有n3种方法,
……
第 r 个步骤有nr种方法.
则完成这件事总 共有n 1 ×n2 × … × nr 种方法 .
排列和组合的区别
顺序不同是不同排列,组合不管顺序
元素无重复排列
(1)将n个不同元素按照一定次序排成一列, 称为全排列,全排列的个数为
元素无重复排列
(2)从n个不同元素中任取 k个(1 ≤ k ≤ n) 元素排成一列,不同的排列总数为
k = n时,则为全排列
元素允许重复的排列
(3)从n个不同元素中取k个(1 ≤ k ≤ n)排成一列, (元素允许重复)不同排列的总数为
组合
(1)组合:从n个不同元素中取 k (1 ≤ k ≤ n) 个元素组成一组,(无次序)称为一个组合,所 有组合的个数为
(2) n个不同元素分为k个(1 ≤ k ≤ n)不 同组,每组元素个数分别为r1,r2,…,rk个的 分法总数为
其中
古典概率的性质
(1) 0 ≤ P(A) ≤ 1;
(2) P(S)=1;
(3) 若事件A、B互斥,则 P(A+B)=P(A)+P(B);
推广:若 A1,A2,„,An 互斥,则: P(A1+ A2 ...+An )= P(A1 ) P(A2 ) +P(An ).
这是概率的加法公式或概率的有限可加性
(4) P() =1 - P(A);
(5) P( ) =0;
(6)若A B,则P(A)<= P(B),且 P(B - A)= P(B)- P(A)
(7) (一般概率加法公式)
P(A B) = P(A) + P(B) - P(AB)
推广:
P(A B C) =P(A) + P(B) + P(C) - P(AB) -P(AC)- P(BC)+ P(ABC)
几何概率;
定义向一区域S(可以是直线区域、平面 区域或空间区域)中掷一质点M,若M必落 在S内,且落在S内任何区域A上的可能性只 与A的度量(如长度,面积, „)成正比,而 与A的位置和形状无关, 则这个试验称为几 何概型试验;定义M落在A中的概率P(A)为
特点:样本空间满足
有无穷多个样本点 — 无限性,
每个样本点发生的可能性相等 — 等可能性.
几何概率的性质
(1) 0 ≤ P(A) ≤ 1;
(2) P(S)=1;
(3) 若 A1,A2,„,An 互斥,则: P(A1 + A2 ..+ An ) = P(A1 ) +P(A2 ) ... + P(An )
古典概率的其它性质对几何概率也同样成立
频率
定义 设A为某一试验的事件,将试验 在相同的条件下重复进行n次,用m表示 A出现的次数, 则
称为事件A的相对频率.
频率的稳定性
在充分多次试验中,事件的频率总 在一个定值附近摆动,而且,试验次 数越多摆动越小.这个性质叫做频率的稳定性
统计概率
定义 在固定条件下,重复做n次试验, 如果当n增大时,事件A出现的频率fn(A) 围绕着某一个常数 p 摆动;随着n的增 大,这种摆动的幅度越来越小,则称常 数 p 为事件A的概率,即
P(A) = p
此定义适合于一切类型的试验.
当n充分大时,频率作为概率的近似值, 即
足以满足实际需要.
频率的性质
(1) 0 <=fn (A) <= 1;
(2) fn (S) = 1;
(3) 若 A1,A2,…,Ak 互斥,则: fn (A1 + A2...+ Ak ) = fn (A1 )+fn (A2 ).. +fn (Ak)
统计概率的性质
(1) 0 ≤ P(A) ≤ 1;
(2) P(S)=1;
(3) 若 A1,A2,…,An 互斥,则: P(A1+A2 ..+ An ) = P(A1 ) +P(A2 ).. P(An )
古典概率的其它性质对统计概率也同样成立..
概率的公理化定义
1933年,苏联数学家 柯尔莫哥洛夫给出了概率的 公理化定义. 通过规定概率应具备的 基本性质来定义概率.
设随机试验的样本空间为S,对每个事 件A,定义P(A) ,且满足 :
公理1 P(A)≥ 0 —— 非负性 ;
公理2 P(S)=1—— 规范性 ;
公理3 若事件A1, A2 ,… 互不相容,则 P(A1 + A2+... )= P(A1 )+ P(A2 ) ——可列可加性; 称P(A)为事件A的概率.
条件概率
性质: 设P(B) > 0.
(1)非负性: P(A| B)>= 0;
(2)规范性: P(S | B) = 1;
(3)可列可加性: 设A1 , A2 , ... 互不相容,则 P((A1 + A2+.. ) | B)= P(A1 | B)+ P(A2 | B)+...
(4) P(| B) = 1 - P(A| B);
(5) P( | B) = 0;
(6)P((A1 -A2) |B) =P(A1 | B) - P(A1A2|B); A1 A2 => P(A1 | B) >= P(A2 | B);
(7)P(A1 U A2 | B) = P(A1 | B)+P(A2 | B) - P(A1A2 | B).
条件概率具有概率的所有性质.
乘法定理
乘法定理
推广
全概率公式
定理 设A1,A2,…,An是两两互斥的事件,且 P(Ai)>0 ,( i =1,2,…,n), 若对任一事件B, 有
(A1+A2 +… +An) B ,则
定理
设A1,A2,…,An是两两互斥的事件,且 P(Ai)>0,(i=1,2,…,n)若对任一事件B, 有 (A1+A2 +… +An)B ,且P (B) > 0, 则
贝叶斯公式(Bayes)
定理 设A1,A2,…,An是两两互斥的事件,且 P(Ai)>0,(i=1,2,…,n)若对任一事件B, 有 (A1+A2 +… +An) B ,且P (B) > 0, 则
P(Ai)和P(Ai |B)分别称为原因的验前概率 和验后概率
两事件的独立性
A的发生并不影响B发生可能性的大小, 这时称事件A、B独立. P(AB)=P(B)P(A|B) 由 P(B)=P(B|A) P(AB)=P(A)P(B).
定义 设A ,B是两个事件,如果 P(AB)= P(A)P(B),则称A与B相互独立.
当P(A)>0,当P(B)>0时, P(AB)= P(A)P(B) P(A|B) = P(A) P(B|A) = P(B)
A与B相互独立 A与B相互独立
三个事件的独立性
定义 设三个事件A、B、C,若
P(AB)= P(A)P(B)
P(AC)= P(A)P(C)
P(BC)= P(B)P(C)
A、B、C两两独立、A、B、C相互独立
P(ABC)= P(A)P(B)P(C)
n个事件独立
定义 设是n个事件,如果对任 意k(1 称相互独立 n重伯努利试验 若一个试验只有两个结果: A和 A , 称试验为伯努利试验. 设P(A) = p (0 < p <1), 则P(A ) = 1-p = q. 将伯努利试验重复、独立地进行n次, 称为n重伯努利试验 注意: 每次试验中 P(A)=p保持不变 各次试验的 结果互不影响 二项概率公式 定理1 设每次试验中成功A的概率为p (0 < p < 1), 则在n重伯努利试验中A恰好 发生k次的概率为 其中 p + q = 1, k = 0, 1, …, n. 二项概率的泊松(Poisson)逼近定理 定理2 如果n→∞, p→0使得np=λ 保持为正常数,则 对k=0,1,2, „一致地成立. 随机变量的概念 定义 设随机试验的样本空间是S. 若对S中的 每个样本点e, 都有唯一的实数值X(e)与之对 应, 称X(e)为随机变量, 简记为X. 随机变量X是基本事件e的函数, 其定义 域为S, 值域为某个实数集合. 随机变量X取某个值或某些值表 示事件,且具有一定的概率. 随机变量通常用大写字母X, Y, Z或 希腊字母ζ, η等表示. 随机变量的取值一般用小写字母x, y, z等表示. 随机变量:离散性、连续型 离散型随机变量 只能取有限个值或可列无穷多个值的随机 变量X 称为离散型随机变量. 概率分布列 为离散型随机变量X的概率分布列, 简称分布列或分布律. 分布列的性质 (1) , 几个常用的离散型分布 两点分布(伯努利分布、 (0-1)分布) 定义 若随机变量X的分布列是 称X服从两点分布或伯努利分布, 也称为 (0 – 1) 分布,记为X ~ B(1, p). 若 P(X=a)=1, 称X服从退化分布. 二项分布(Binomial) 定义 若随机变量X的分布列是 称X服从参数为n, p的二项分布,记为 X~B(n, p). 当n = 1时, 为两点分布. 泊松分布(Poisson) 定义 若随机变量X的分布列 称X服从参数为 的泊松分布,记为X ~ P( ). 几何分布(Geometric) 定义 若随机变量X的分布列 称X服从参数为p的几何分布,记为X ~G(p).
定义 设有N件产品, 其中有M件次品. 今从 中任取n件不同产品, 则这n件中所含的次品 数X的分布列为 规定当i > m时, . 称X服从超几何分布. 二项分布用来描述有放回抽样. 超几何分布用来描述不放回抽样. 当总体N很大, 抽样数n较小时, 可用二项分布来逼近超几何分布. 分布函数: 定义 设X为一随机变量, 称 . 为X的分布函数, 记为F (x)或FX (x). 随机变量都有分布函数. 分布函数的几何意义 利用分布函数计算概率 设随机变量X的分布函数为F(x), a
分布函数的性质 (i) (ii) ,即F(x)是单调非减的; (iii) (iv) 即F(x)是右连续的. 连续型随机变量 定义 设随机变量X的分布函数为F(x), 若存 在一个非负的函数f(x), 对任何实数x, 有 称X为连续型随机变量, 称f(x)为X的概率密度函数, 简称概率密度.也可记为. 由定义, 可得下面两个结论 (1)连续型随机变量的分布函数一定是连续的; (2)对f(x)的连续点, 有 F(x)与f(x)可以互推. 概率密度的性质 (1) (2) 这两条是判定函数 f (x) 是否为概率密 度函数的充要条件. 连续型随机变量取任一指定值的概率为0, 即 P ( X = a ) = 0.这是因为 由F(x)连续得 不能推出 同理 不能推出 不能推出 几种重要的连续型随机变量 均匀分布(Uniform) 定义 若随机变量X的概率密度为 称X在区间[a, b]上服从均匀分布,记为X ~ U[a, b]. 均匀的含义是等可能 若X ~ U[a, b], (x1, x2)为[a, b]中的任一子区间, 则 说明: X落在长度相等的各个子区间的可能 性是相等的.属于几何概率. 若X~U[a,b],则. 概率密度的性质 若X ~ U[a, b] ,则X的分布函数 指数分布(Exponential) 定义 若连续型随机变量X的概率密度 称X服从参数为 的指数分布.记为X ~ E( ). 分布函数为: 指数分布常用来近似地表示各种寿命的分布. 指数分布的无记忆性 正态分布(Normal) 定义 若随机变量X的概率密度为 为常数, 且 , 称X 服从参数为 的正态分布或高斯(Gauss)分布, 也称X为正态变量, 记作. 正态分布密度曲线特征 (1) 关于 对称; (2) 当时, f (x)取得最大值 ; (3) 当时, (4)曲线在处有拐点; (5) 决定对称轴的位置. 当固定 值,改变 值时, 的形状不变,只是沿着 轴平移; (6) 决定离散程度. 当固定值,改变值时, f(x)的对称轴不 变,但形状改变. 越大,图形越矮越胖,越小,图形越高越瘦. 正态变量X的分布函数 标准正态分布定义 若X~N(0,1) ,称X服从标准正态分布. 概率密度为 分布函数为; 一般的正态分布的分布函数与标 准正态分布的分布函数 间的关系为 即,若,则 离散型随机变量函数的分布 连续型随机变量函数概率密度的两种求法 分布函数法 已知X的概率密度,分布函数,Y=g(X), 求Y概率密度,分两步: (1)先求Y的分布函 解出,解除X 表示成X的分布函数; (2)求导数:. 公式法 设X的概率密度, y =g(x)为(a,b)上严 格单调可微函数,则Y g(X)的 概率密度为 其中h(y)为g(x)的反函数且A min{g(a), g(b)}, B max{g(a), g(b)}. 多维随机变量 定义 若定义在同一样 本空间S上的n个随机变量,称 为 n 维随机变量或 n 维随机向量,简记为 . 二维随机变量(X,Y)的分布函数 二维随机变量(X, Y) 为X和Y的联合分布函数 两事件同时发生) 分布函数的性质 (1)对任意实数有; (2)任意; 任意. 即对每个自变量都是单调不减的; (3)对任意有 (4); (5)对任意实数,有. 因为 设二维随机变量的分布函数 称与各自的分布函数和为 的边缘分布函数或关于和的边缘分布 函数. 即 同理, 二维离散型随机变量 定义1 若二维随机变量所有可能取 值是有限对或可列无限多对,则称为 二维离散型随机变量. 定义2设的所有可能取值为,称 , 为的分布列或X和Y的联合分布列. (X,Y)的分布列也可用列表法表示: (X,Y)分布列的性质: (1) ; (2) X,Y的边缘分布列 设离散型随机变量(X,Y)的分布列为 二维离散型随机变量( X, Y )的分布函数: 和式是对所有满足 的求和. 二维连续型随机变量 二维连续型随机变量 X和Y的联合概率密度 定义 设二维随机变量(X,Y)的分布函数为 F(x ,y) ,若存在非负函数f(x, y),使得对任意 实数x, y有 称(X, Y)为二维连续型随机变量, 称f(x, y)为 二维随机变量(X,Y)的概率密度, 或称为X与 Y的联合概率密度. 概率密度的性质 (1) (3) 设G是xOy平面上的一个区域,则点(X,Y) 落在G中的概率为 (4) 在的连续点有 边缘概率密度 设二维连续型随机变量(X,Y)的密度函数为,称 为二维随机变量(X,Y)的边缘概率密度. 二维均匀分布 设G是平面上的有界区域,其面积为 S(G).若二维随机变量(X,Y)具有概率密度 则称(X,Y)在G上服从均匀分布 ,且 满足概率密度的两个基本性质. 二维正态分布 设二维随机变量(X,Y)的概率密度 其中 ,都是常数,称(X,Y) 服从参数为 的二维正态分布,记 为 二维正态分布的两个边缘分布都是一维 正态分布,即 随机变量的独立性 两事件A, B独立的定义是: 若P(AB)=P(A)P(B) 则称事件A, B独立 . 设X, Y是两个随机变量,若对任意的实数x, y, 令,则 定义 设依次为的分布函数.若对任意实数成立 称X与Y相互独立. X,Y为连续型随机变量时,X与Y独立的充要条件是 这里分别是的概率密度. X,Y为离散型随机变量时,X与Y独立的充要条件是 这里分别是 的分布列. n维随机变量的一些概念 n维随机变量的分布函数 设为n维随机变量,为任意实数,则n元函数 称为的分布函数. n维随机变量的概率密度 设为n维随机变量的分布函数.若存在非负函数, 对 任意实数有 , 称为连续型随机变量,为n维随机变量的概率密度. n维随机变量的相互独立 设为n维随机变量的分布函数.若对任意实数有 则称是相互独立的. 对连续型随机变量,则相互独立 的充要条件是 . 离散型随机变量函数的分布 设二维离散型随机变量的分布列为 , 则是一维离散型随机变量,用 表示Z的取值,则Z的 分布列 , 连续型随机变量函数的分布 设是二维连续型随机变量,其概率 密度为, ,求的概率密度 或分布函数 分布函数法: 连续型随机变量Z=X+Y的分布 设X和Y的联合密度为 f (x,y), 则Z=X+Y的分布函数为 故Z=X+Y的概率密度为 由X和Y的对称性,又可写成 积公式 当X与 Y 立时,称Z=X+Y的概率 密度公式为卷积公式, 即 Max(X,Y)及min(X,Y)的分布 设X,Y是两个相互独立的随机变量,它们的 分布函数分别为和,求 及的分布函数和. 分布函数为 的分布函数为 n个独立随机变量的最值分布 设是n个相互独立的随机变量,它们的分布函数分别为 FXi (xi ), i 1, 2, , n. 11.二项概率公式
12.随机变量函数的分布
13.离散型随机变量
14.随机变量的分布函数
15.连续型随机变量
16.正态分布
17.随机变量的函数分布
18.多维随机变量,分布函数、边缘分布函数
19.二维离散型随机变量
20.二维连续性随机变量
21.随机变量的独立性
22.二维随机变量函数的分布
23.条件分布
24.随机变量的数学期望
25.随机变量的方差
26.协方差和相关系数
27.大数定律
28.中心极限定理
29.总体与样本
30.X2分布、T分布、F分布
31.统计量与抽样分布
32.点估计
33.区间估计
34.假设检验的基本概念
35.单个正态总体参数的显著性检验
36.两个正态总体参数的显著性检验
37.拟合优度检验(非参数检验)
38.单因素的方差分析
39.一元线性回归