事件的包含:
(1) A B : 事件A发生必导致事件B发生.
事件的相等
事件的积:
(3)A ∩B:事件A与B同时发生,简记AB;
互不相容事件(互斥事件):
(4): A与B不能同时发生.
事件的和(并)
(5) A ∪B:事件A与B至少有一个发生, 当 : A ∪B =A+B.
事件的差:
6)A -B:A发生而B不发生.
对立事件(逆事件)
7): 由A不发生所构成的事件.
事件的运算性质;
交换律: A ∪B=B∪A , AB=BA;
结合律:(A∪B)∪C=A∪( B∪C), (AB)C=A(BC);
分配律: (A∪B)C=(AC)∪(BC), (AB)∪C=(A∪C)(B∪C);
对偶原则(德—摩根律) :
概率:表示事件A发生可能性大小的 数值,称为事件A的概率,记为P(A);概率是随机事件的函数.
古典概率的定义:
若试验的样本空间S满足:
只有有限个样本点 — 有限性,
每个样本点发生的可能性相等 — 等可能性.
称此试验为古典概型试验.
古典概率的计算公式:
在古典概型下,事件A的概率定义为:
这里计算样本点数的主要工具是排列、组合.
加法原理
设完成一件事有m种方式
第一种方式有n1种方法,
第二种方式有n2种方法,
……
第m种方式有nm种方法,
则完成这件事总共有 n1 + n2 + … + nm 种方法 .
乘法原理
设完成一件事必须经过r个步骤,
第一个步骤有n1种方法,
第二个步骤有n2种方法,
第三个步骤有n3种方法,
……
第 r 个步骤有nr种方法.
则完成这件事总 共有n 1 ×n2 × … × nr 种方法 .
排列和组合的区别
顺序不同是不同排列,组合不管顺序
元素无重复排列
(1)将n个不同元素按照一定次序排成一列, 称为全排列,全排列的个数为
元素无重复排列
(2)从n个不同元素中任取 k个(1 ≤ k ≤ n) 元素排成一列,不同的排列总数为
k = n时,则为全排列
元素允许重复的排列
(3)从n个不同元素中取k个(1 ≤ k ≤ n)排成一列, (元素允许重复)不同排列的总数为
组合
(1)组合:从n个不同元素中取 k (1 ≤ k ≤ n) 个元素组成一组,(无次序)称为一个组合,所 有组合的个数为
(2) n个不同元素分为k个(1 ≤ k ≤ n)不 同组,每组元素个数分别为r1,r2,…,rk个的 分法总数为
其中
古典概率的性质
(1) 0 ≤ P(A) ≤ 1;
(2) P(S)=1;
(3) 若事件A、B互斥,则 P(A+B)=P(A)+P(B);
推广:若 A1,A2,„,An 互斥,则: P(A1+ A2 ...+An )= P(A1 ) P(A2 ) +P(An ).
这是概率的加法公式或概率的有限可加性
(4) P() =1 - P(A);
(5) P( ) =0;
(6)若A B,则P(A)<= P(B),且 P(B - A)= P(B)- P(A)
(7) (一般概率加法公式)
P(A B) = P(A) + P(B) - P(AB)
推广:
P(A B C) =P(A) + P(B) + P(C) - P(AB) -P(AC)- P(BC)+ P(ABC)
几何概率;
定义向一区域S(可以是直线区域、平面 区域或空间区域)中掷一质点M,若M必落 在S内,且落在S内任何区域A上的可能性只 与A的度量(如长度,面积, „)成正比,而 与A的位置和形状无关, 则这个试验称为几 何概型试验;定义M落在A中的概率P(A)为
特点:样本空间满足
有无穷多个样本点 — 无限性,
每个样本点发生的可能性相等 — 等可能性.
几何概率的性质
(1) 0 ≤ P(A) ≤ 1;
(2) P(S)=1;
(3) 若 A1,A2,„,An 互斥,则: P(A1 + A2 ..+ An ) = P(A1 ) +P(A2 ) ... + P(An )
古典概率的其它性质对几何概率也同样成立
频率
定义 设A为某一试验的事件,将试验 在相同的条件下重复进行n次,用m表示 A出现的次数, 则
称为事件A的相对频率.
频率的稳定性
在充分多次试验中,事件的频率总 在一个定值附近摆动,而且,试验次 数越多摆动越小.这个性质叫做频率的稳定性
统计概率
定义 在固定条件下,重复做n次试验, 如果当n增大时,事件A出现的频率fn(A) 围绕着某一个常数 p 摆动;随着n的增 大,这种摆动的幅度越来越小,则称常 数 p 为事件A的概率,即
P(A) = p
此定义适合于一切类型的试验.
当n充分大时,频率作为概率的近似值, 即
足以满足实际需要.
频率的性质
(1) 0 <=fn (A) <= 1;
(2) fn (S) = 1;
(3) 若 A1,A2,…,Ak 互斥,则: fn (A1 + A2...+ Ak ) = fn (A1 )+fn (A2 ).. +fn (Ak)
统计概率的性质
(1) 0 ≤ P(A) ≤ 1;
(2) P(S)=1;
(3) 若 A1,A2,…,An 互斥,则: P(A1+A2 ..+ An ) = P(A1 ) +P(A2 ).. P(An )
古典概率的其它性质对统计概率也同样成立..
概率的公理化定义
1933年,苏联数学家 柯尔莫哥洛夫给出了概率的 公理化定义. 通过规定概率应具备的 基本性质来定义概率.
设随机试验的样本空间为S,对每个事 件A,定义P(A) ,且满足 :
公理1 P(A)≥ 0 —— 非负性 ;
公理2 P(S)=1—— 规范性 ;
公理3 若事件A1, A2 ,… 互不相容,则 P(A1 + A2+... )= P(A1 )+ P(A2 ) ——可列可加性; 称P(A)为事件A的概率.
条件概率
性质: 设P(B) > 0.
(1)非负性: P(A| B)>= 0;
(2)规范性: P(S | B) = 1;
(3)可列可加性: 设A1 , A2 , ... 互不相容,则 P((A1 + A2+.. ) | B)= P(A1 | B)+ P(A2 | B)+...
(4) P(| B) = 1 - P(A| B);
(5) P( | B) = 0;
(6)P((A1 -A2) |B) =P(A1 | B) - P(A1A2|B); A1 A2 => P(A1 | B) >= P(A2 | B);
(7)P(A1 U A2 | B) = P(A1 | B)+P(A2 | B) - P(A1A2 | B).
条件概率具有概率的所有性质.
乘法定理
乘法定理
推广
全概率公式
定理 设A1,A2,…,An是两两互斥的事件,且 P(Ai)>0 ,( i =1,2,…,n), 若对任一事件B, 有
(A1+A2 +… +An) B ,则
定理
设A1,A2,…,An是两两互斥的事件,且 P(Ai)>0,(i=1,2,…,n)若对任一事件B, 有 (A1+A2 +… +An)B ,且P (B) > 0, 则
贝叶斯公式(Bayes)
定理 设A1,A2,…,An是两两互斥的事件,且 P(Ai)>0,(i=1,2,…,n)若对任一事件B, 有 (A1+A2 +… +An) B ,且P (B) > 0, 则
P(Ai)和P(Ai |B)分别称为原因的验前概率 和验后概率
两事件的独立性
A的发生并不影响B发生可能性的大小, 这时称事件A、B独立. P(AB)=P(B)P(A|B) 由 P(B)=P(B|A) P(AB)=P(A)P(B).
定义 设A ,B是两个事件,如果 P(AB)= P(A)P(B),则称A与B相互独立.
当P(A)>0,当P(B)>0时, P(AB)= P(A)P(B) P(A|B) = P(A) P(B|A) = P(B)
A与B相互独立 A与B相互独立
三个事件的独立性
定义 设三个事件A、B、C,若
P(AB)= P(A)P(B)
P(AC)= P(A)P(C)
P(BC)= P(B)P(C)
A、B、C两两独立、A、B、C相互独立
P(ABC)= P(A)P(B)P(C)
n个事件独立
定义 设 称 n重伯努利试验 若一个试验只有两个结果: A和 A , 称试验为伯努利试验. 设P(A) = p (0 < p <1), 则P(A ) = 1-p = q. 将伯努利试验重复、独立地进行n次, 称为n重伯努利试验 注意: 每次试验中 P(A)=p保持不变 各次试验的 结果互不影响 二项概率公式 定理1 设每次试验中成功A的概率为p (0 < p < 1), 则在n重伯努利试验中A恰好 发生k次的概率为 其中 p + q = 1, k = 0, 1, …, n. 二项概率的泊松(Poisson)逼近定理 定理2 如果n→∞, p→0使得np=λ 保持为正常数,则 对k=0,1,2, „一致地成立. 随机变量的概念 定义 设随机试验的样本空间是S. 若对S中的 每个样本点e, 都有唯一的实数值X(e)与之对 应, 称X(e)为随机变量, 简记为X. 随机变量X是基本事件e的函数, 其定义 域为S, 值域为某个实数集合. 随机变量X取某个值或某些值表 示事件,且具有一定的概率. 随机变量通常用大写字母X, Y, Z或 希腊字母ζ, η等表示. 随机变量的取值一般用小写字母x, y, z等表示. 随机变量:离散性、连续型 离散型随机变量 只能取有限个值或可列无穷多个值的随机 变量X 称为离散型随机变量. 概率分布列 为离散型随机变量X的概率分布列, 简称分布列或分布律. 分布列的性质 (1) 几个常用的离散型分布 两点分布(伯努利分布、 (0-1)分布) 定义 若随机变量X的分布列是 称X服从两点分布或伯努利分布, 也称为 (0 – 1) 分布,记为X ~ B(1, p). 若 P(X=a)=1, 称X服从退化分布. 二项分布(Binomial) 定义 若随机变量X的分布列是 当n = 1时, 泊松分布(Poisson) 定义 若随机变量X的分布列 称X服从参数为 几何分布(Geometric) 定义 若随机变量X的分布列 称X服从参数为p的几何分布,记为X ~G(p).
定义 设有N件产品, 其中有M件次品. 今从 中任取n件不同产品, 则这n件中所含的次品 数X的分布列为 规定当i > m时, 称X服从超几何分布. 二项分布用来描述有放回抽样. 超几何分布用来描述不放回抽样. 当总体N很大, 抽样数n较小时, 可用二项分布来逼近超几何分布. 分布函数: 定义 设X为一随机变量, 称 记为F (x)或FX (x). 随机变量都有分布函数. 分布函数的几何意义 利用分布函数计算概率 设随机变量X的分布函数为F(x), a
分布函数的性质 (i) (ii) (iii) (iv) 连续型随机变量 定义 设随机变量X的分布函数为F(x), 若存 在一个非负的函数f(x), 对任何实数x, 有 称X为连续型随机变量, 称f(x)为X的概率密度函数, 简称概率密度.也可记为 由定义, 可得下面两个结论 (1)连续型随机变量的分布函数一定是连续的; (2)对f(x)的连续点, 有 概率密度的性质 (1) (2) 这两条是判定函数 f (x) 是否为概率密 度函数的充要条件. 连续型随机变量取任一指定值的概率为0, 即 P ( X = a ) = 0.这是因为 由F(x)连续得 同理 几种重要的连续型随机变量 均匀分布(Uniform) 定义 若随机变量X的概率密度为 称X在区间[a, b]上服从均匀分布,记为X ~ U[a, b]. 均匀的含义是等可能 若X ~ U[a, b], (x1, x2)为[a, b]中的任一子区间, 则 说明: X落在长度相等的各个子区间的可能 性是相等的.属于几何概率. 若X~U[a,b],则 概率密度的性质 若X ~ U[a, b] ,则X的分布函数 指数分布(Exponential) 定义 若连续型随机变量X的概率密度 称X服从参数为 的指数分布.记为X ~ E( 分布函数为: 指数分布常用来近似地表示各种寿命的分布. 指数分布的无记忆性 正态分布(Normal) 定义 若随机变量X的概率密度为 正态分布密度曲线特征 (1) 关于 (2) 当 (3) 当 (4)曲线在 (5) (6) 正态变量X的分布函数 标准正态分布定义 若X~N(0,1) ,称X服从标准正态分布. 概率密度为 分布函数为; 一般的正态分布 即,若 离散型随机变量函数的分布 连续型随机变量函数概率密度的两种求法 分布函数法 已知X的概率密度 (1)先求Y的分布函 (2)求导数: 公式法 设X的概率密度 其中h(y)为g(x)的反函数且A min{g(a), g(b)}, B max{g(a), g(b)}. 多维随机变量 定义 若 二维随机变量(X,Y)的分布函数 二维随机变量(X, Y) 为X和Y的联合分布函数 分布函数的性质 (1)对任意实数 (2) 即 (3)对任意 (4) (5)对任意实数 设二维随机变量 同理, 二维离散型随机变量 定义1 若二维随机变量 定义2设 (X,Y)的分布列也可用列表法表示: (X,Y)分布列的性质: (1) (2) X,Y的边缘分布列 设离散型随机变量(X,Y)的分布列为 二维离散型随机变量( X, Y )的分布函数: 和式是对所有满足 二维连续型随机变量 二维连续型随机变量 X和Y的联合概率密度 定义 设二维随机变量(X,Y)的分布函数为 F(x ,y) ,若存在非负函数f(x, y),使得对任意 实数x, y有 概率密度的性质 (1) (3) 设G是xOy平面上的一个区域,则点(X,Y) 落在G中的概率为 (4) 在 边缘概率密度 设二维连续型随机变量(X,Y)的密度函数为 为二维随机变量(X,Y)的边缘概率密度. 二维均匀分布 设G是平面上的有界区域,其面积为 S(G).若二维随机变量(X,Y)具有概率密度 则称(X,Y)在G上服从均匀分布 满足概率密度的两个基本性质. 二维正态分布 设二维随机变量(X,Y)的概率密度 其中 二维正态分布的两个边缘分布都是一维 正态分布,即 随机变量的独立性 两事件A, B独立的定义是: 若P(AB)=P(A)P(B) 则称事件A, B独立 . 设X, Y是两个随机变量,若对任意的实数x, y, 令 定义 设 称X与Y相互独立. X,Y为连续型随机变量时,X与Y独立的充要条件是 这里 X,Y为离散型随机变量时,X与Y独立的充要条件是 这里 n维随机变量的一些概念 n维随机变量的分布函数 设 n维随机变量的概率密度 设 n维随机变量的相互独立 设 离散型随机变量函数的分布 设二维离散型随机变量 连续型随机变量函数的分布 设 分布函数法: 连续型随机变量Z=X+Y的分布 设X和Y的联合密度为 f (x,y), 则Z=X+Y的分布函数为 故Z=X+Y的概率密度为 由X和Y的对称性, 积公式 当X与 Y 立时,称Z=X+Y的概率 密度公式为卷积公式, 即 Max(X,Y)及min(X,Y)的分布 设X,Y是两个相互独立的随机变量,它们的 分布函数分别为 n个独立随机变量的最值分布 设 是n个事件,如果对任 意k(1
相互独立
11.二项概率公式
12.随机变量函数的分布
13.离散型随机变量
,
称X服从参数为n, p的二项分布,记为 X~B(n, p).
为两点分布.
的泊松分布,记为X ~ P(
).
.
14.随机变量的分布函数
. 为X的分布函数,
,即F(x)是单调非减的;
即F(x)是右连续的.
15.连续型随机变量
.
F(x)与f(x)可以互推.
不能推出
不能推出
不能推出
.
).
16.正态分布
为常数, 且
, 称X 服从参数为
的正态分布或高斯(Gauss)分布, 也称X为正态变量, 记作
.
对称;
时, f (x)取得最大值
;
时,
处有拐点;
决定对称轴的位置. 当固定
值,改变
值时,
的形状不变,只是沿着
轴平移;
决定离散程度. 当固定
值,改变
值时, f(x)的对称轴不 变,但形状改变.
越大,图形越矮越胖,
越小,图形越高越瘦.
的分布函数
与标 准正态分布的分布函数
间的关系为
,则
17.随机变量的函数分布
,分布函数
,Y=g(X), 求Y概率密度
,分两步:
解出
,解除X 表示成X的分布函数;
.
, y =g(x)为(a,b)上严 格单调可微函数
,则Y g(X)的 概率密度为
18.多维随机变量,分布函数、边缘分布函数
定义在同一样 本空间S上的n个随机变量,称
为 n 维随机变量或 n 维随机向量,简记为
.
两事件同时发生)
有
;
任意;
任意.
对每个自变量都是单调不减的;
有
;
,有
. 因为
的分布函数
称
与
各自的分布函数
和
为
的边缘分布函数或
关于
和
的边缘分布 函数. 即
19.二维离散型随机变量
所有可能取 值是有限对或可列无限多对,则称
为 二维离散型随机变量.
的所有可能取值为
,称
, 为
的分布列或X和Y的联合分布列.
;
的
求和.
20.二维连续性随机变量
称(X, Y)为二维连续型随机变量, 称f(x, y)为 二维随机变量(X,Y)的概率密度, 或称为X与 Y的联合概率密度.
的连续点有
,称
,且
,都是常数,称(X,Y) 服从参数为
的二维正态分布,记 为
21.随机变量的独立性
,则
依次为
的分布函数.若对任意实数
成立
分别是
的概率密度.
分别是
的分布列.
为n维随机变量,
为任意实数,则n元函数
称为
的分布函数.
为n维随机变量
的分布函数.若存在非负函数
, 对 任意实数
有
, 称
为连续型随机变量,
为n维随机变量的概率密度.
为n维随机变量
的分布函数.若对任意实数
有
则称
是相互独立的. 对连续型随机变量,则
相互独立 的充要条件是
.
22.二维随机变量函数的分布
的分布列为
, 则
是一维离散型随机变量,用
表示Z的取值,则Z的 分布列 ,
是二维连续型随机变量,其概率 密度为
,
,求
的概率密度
或分布函数
又可写成
和
,求
及
的分布函数
和
.
分布函数为
的分布函数为
是n个相互独立的随机变量,它们的分布函数分别为 FXi (xi ), i 1, 2, , n.
23.条件分布
24.随机变量的数学期望
25.随机变量的方差
26.协方差和相关系数
27.大数定律
28.中心极限定理
29.总体与样本
30.X2分布、T分布、F分布
31.统计量与抽样分布
32.点估计
33.区间估计
34.假设检验的基本概念
35.单个正态总体参数的显著性检验
36.两个正态总体参数的显著性检验
37.拟合优度检验(非参数检验)
38.单因素的方差分析
39.一元线性回归