2.1 随机变量及其分布函数
1. 随机变量
-
在随机试验的可能结果和数之间建立对应关系
- 随机变量:设 Ω 为一个试验的样本空间,如果对每一个样本点 ω ∈ Ω,规定一个实数 X(ω),这样就定义了一个定义域为 Ω 的实值函数 X = X(ω),称 X 为随机变量
- 随机变量是确定的函数
- 其定义域是样本空间
- 随机变量取值具有随机性,取值具有一定的概率
- 注意:X 取值的统计规律性在其取值范围无限的情形下,并不能用单点集上的可能性刻画。比如, X 表示 (0,1) 上随机取点的坐标,那么,P(X = a) = 0。
2. 分布函数
- 分布函数:设X是以随机变量,对任意实数x,定义F(x) = P(X≤x) 称F(x)为随机变量X的分布函数。
- P(a < X ≤ b) = P(X ≤ b) − P(X ≤ a) = F(b) − F(a)
- 定理:F(x) 为随机变量 X 的分布函数,则
- 当 x1 < x2 时, F(x1) ≤ F(x2), 即 F(x) 单调不减
- F(x) 右连续, 即 F(x) = F(x + 0)
- 对任意的 x0, P(X = x0) = F(x0) − F(x0 − 0)
- 满足前三条定理的函数一定是某个随机变量的分布函数
2.2 常见离散型分布
1. 离散型随机变量的概率分布
称上式为离散型随机变量 X 的概率分布, 或概率函数(分布律)
2.常见离散型分布
- 可列重伯努利试验:在 n 重伯努利试验中, 试验可以一直重复下去
- 几何分布 X ∼ G(p):在成功概率为p的可列重伯努利试验中,事件A首次出现在第k次试验的概率,其中0 < p < 1
- 超几何分布 X ∼ H(n, m, N):设 M, N, n 为正整数, 并且 M ≤ N, n ≤ N, 若随机变量X有分布律
- 二项分布 X ∼ B(n, p):考虑成功概率为p的n重伯努利试验,事件A成功发生次数为X
-
0 < p < 1
-
- 0-1分布:n = 1 时,X ~ B(1, p)
- 二项分布和超几何分布:当N都很大时, 二项概率和超几何概率有如下近似(当N很大时,不放回抽取可以视为有放回抽取)
- 泊松分布 X ∼ P(λ):设随机变量,且满足=,则
- 适用于p较小(通常≤0.1),且n较大(n≥50),二项分布的概率函数近似于泊松分布
- 近似服从泊松分布的场合:近乎独立的小概率事件的累计发生次数
- 显微镜下落在某区域中微生物数, 一年内某地区的地震次数
2.3 连续型随机变量及其分布
1. 连续型随机变量及其概率密度函数
2. 几种常见连续型分布
- 均匀分布X ∼ U(a, b):设随机变量 X 的密度函数为
称 X 在区间 [a, b] 上服从均匀分布
分布函数
- 函数与分布:解决的问题为要等到n个随机事件都发生,需要经历多久时间
- 函数:设 α > 0, 关于 α 的含参积分
-
-
函数的性质
- 分布:设随机变量X有密度函数
- α, β > 0 为常数
- X ∼ Γ(α, β)
- 当 α = 1 时, Γ 分布 Γ(1, β) 为指数分布 e(β)
2.4 随机变量及其分布
1. 离散型随机变量函数的分布:若X与Y存在映射关系,可以可以建立 X 和 Y 的分布列之间的关系
2. 连续型随机变量函数的分布:求Y分布函数以及密度函数的方法
设 X 有密度函数
- 由 X 的取值区间,求出 Y 的值域 R(Y)
- 求出 Y 的分布函数, 对于 y ∈ R(Y)