hello,大家好
这里是第十期的概率论与数理统计的学习,我将用这篇博客去总结知识点和用C语言实现案例的过程。
本期知识点——期望
- 离散型随机变量的期望
- 连续型随机变量的期望
- 随机变量函数的期望
- 期望的性质
随机变量的分布函数是对随机变量概率性质的完整的刻画,描述了随机变量的统计规律性。
但在实际问题中有时不容易确定随机变量的分布,也没那个必要,而我们只需要知道它的某些特征就行了。这些特征就是随机变量的数字特征,是由随机变量的分布所决定的常数。
例如,对一射手进行技术评定时,经常考察射击命中环数的平均值;检查一批棉花的质量时,所关心的是棉花纤维的平均长度等。也就是我们不需要了解一批东西全部的情况,那样太费时间,效率不高,而通过平均值就能看出一个整体的大概情况。这个平均值就是数学期望,简称为期望
下面开始知识总结
定义:设离散型随机变量的概率分布为 P { X = x i } = p i i = 1 , 2 , . . . P\{X=x_{i}\}=p_{i}~~~~~~~~i=1,2,... P{X=xi}=pi i=1,2,...
若级数 ∑ i x i p i \displaystyle\sum_{i}x_{i}p_{i} i∑xipi绝对收敛,即 ∑ i ∣ x i ∣ p i \displaystyle\sum_{i}|x_{i}|p_{i} i∑∣xi∣pi收敛,则称 ∑ i x i p i \displaystyle\sum_{i}x_{i}p_{i} i∑xipi为随机变量 X X X的期望,记为 E ( X ) E(X) E(X)。即 E ( X ) = ∑ i x i p i E(X)=\displaystyle\sum_{i}x_{i}p_{i} E(X)=i∑xipi
为什么要保证那个级数绝对收敛?
在 X X X可列无限个值时,级数 ∑ i x i p i \displaystyle\sum_{i}x_{i}p_{i} i∑xipi绝对收敛可以保证级数之值不因级数各项次序的改排而变化,这样 E ( X ) E(X) E(X)与 X X X取的值的人为排列次序无关。
如何理解期望和均值?
期望的定义就是随机变量 X X X的值乘上它表示的事件发生的概率。所以将 E ( X ) E(X) E(X)成为 X X X的均值更能反应这个概念的本质。
下面介绍几种常用的离散型随机变量的期望,后续都会用C语言实现
X | 1 | 0 |
---|---|---|
P | p | 1-p |
E ( X ) = 1 × p + 0 × ( 1 − p ) = p E(X)=1\times p+0\times (1-p)=p E(X)=1×p+0×(1−p)=p
设 X X X~ B ( n , p ) B(n,p) B(n,p),概率分布为 P { X = k } = C n k p k ( 1 − p ) n − k k = 0 , 1 , 2 , . . . , n P\{X=k\}=C_{n}^kp^k(1-p)^{n-k}~~~~~~~~~k=0,1,2,...,n P{X=k}=Cnkpk(1−p)n−k k=0,1,2,...,n
E ( X ) = n p E(X)=np E(X)=np
设 X X X~ P ( λ ) P(\lambda) P(λ),概率分布为 P { X = k } = λ k k ! e − λ k = 0 , 1 , 2 , . . . P\{X=k\}=\frac{\lambda^{k}}{k!}e^{-\lambda}~~~~~~~k=0,1,2,... P{X=k}=k!λke−λ k=0,1,2,...
E ( X ) = λ E(X)=\lambda E(X)=λ
定义:设连续型随机变量 X X X的概率密度函数为 f ( x ) f(x) f(x),若积分 ∫ − ∞ + ∞ x f ( x ) d x \int_{-\infty}^{+\infty}xf(x)dx ∫−∞+∞xf(x)dx绝对收敛,即 ∫ − ∞ + ∞ ∣ x ∣ f ( x ) d x \int_{-\infty}^{+\infty}|x|f(x)dx ∫−∞+∞∣x∣f(x)dx收敛,则称积分 ∫ − ∞ + ∞ x f ( x ) d x \int_{-\infty}^{+\infty}xf(x)dx ∫−∞+∞xf(x)dx的值为随机变量 X X X的期望,记为 E ( X ) E(X) E(X),即 E ( X ) = ∫ − ∞ + ∞ x f ( x ) d x E(X)=\int_{-\infty}^{+\infty}xf(x)dx E(X)=∫−∞+∞xf(x)dx
下面介绍几种常用的连续型随机变量的期望
设 X X X~ U [ a , b ] U[a,b] U[a,b],概率密度函数为 f ( x ) = { 1 b − a a ≤ x ≤ b 0 其它 f(x)=\begin{cases} \frac{1}{b-a}~~~~~~a\leq x\leq b\\ 0~~~~~~~~~其它\\ \end{cases} f(x)={b−a1 a≤x≤b0 其它
E ( X ) = ∫ a b x b − a d x = 1 2 ( a + b ) E(X)=\int_{a}^b\frac{x}{b-a}dx=\frac12(a+b) E(X)=∫abb−axdx=21(a+b)
设 X X X服从参数为 λ \lambda λ的指数分布,概率密度函数为 f ( x ) = { λ e − λ x x ≥ 0 0 x < 0 λ > 0 f(x)=\begin{cases} \lambda e^{-\lambda x}~~~~x\geq 0\\ 0~~~~~~~~~~~~x<0\\ \end{cases}~~~~~~~\lambda>0 f(x)={λe−λx x≥00 x<0 λ>0
E ( X ) = ∫ 0 + ∞ λ x e − λ x d x = 1 λ E(X)=\int_{0}^{+\infty}\lambda xe^{-\lambda x}dx=\frac1\lambda E(X)=∫0+∞λxe−λxdx=λ1
设 X X X~ N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2),概率密度函数为 f ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 , − ∞ < x < + ∞ f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}},-\infty
E ( X ) = ∫ − ∞ + ∞ x 2 π σ e − ( x − μ ) 2 2 σ 2 d x E(X)=\int_{-\infty}^{+\infty}\frac{x}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}dx E(X)=∫−∞+∞2πσxe−2σ2(x−μ)2dx
令 t = x − μ σ t=\frac{x-\mu}{\sigma} t=σx−μ,可得 ∫ − ∞ + ∞ x 2 π σ e − ( x − μ ) 2 2 σ 2 d x = 1 2 π ∫ − ∞ + ∞ ( μ + σ t ) e − t 2 2 d t = μ \int_{-\infty}^{+\infty}\frac{x}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}dx=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{+\infty}(\mu+\sigma t)e^{-\frac{t^2}{2}}dt=\mu ∫−∞+∞2πσxe−2σ2(x−μ)2dx=2π1∫−∞+∞(μ+σt)e−2t2dt=μ
最后可得 E ( X ) = μ E(X)=\mu E(X)=μ
定义:设 g ( x ) g(x) g(x)是连续函数, Y Y Y是随机变量 X X X的函数: Y = g ( X ) Y=g(X) Y=g(X)。
根据上面的结论,我们可以推广到两个随机变量函数 Z = g ( X , Y ) Z=g(X,Y) Z=g(X,Y)的情形:
题目分析:题目的要求是只要有一次检验,十件产品中次品数大于1,就需调整设备。而一天中又要检验4天,并且求的是一天中调整设备的次数。所以我们可以先求出每一次检验后需要调整设备的概率,然后就可以转化为二项分布 X X X~ B ( n , p ) B(n,p) B(n,p),求得一天中四次检验需要调整设备的期望。
#include
// The algorithm of Combination ——组合的算法
int Combination(int n,int m)
{
int sum = 1,p = 1;
for( ; m > 0 ; m--)
{
sum *= n--;
p *= m;
}
return sum/p;
}
// The algorithm of Binary Distrubution ——二项分布的算法
float BinDistrubution(int n,int k,float p)
{
float _P;
_P = Combination(n,k);
for(int i = 0 ; i < k ; i++)
_P *= p;
for(int i = 0 ; i < n - k ; i++)
_P *= (1 - p);
return _P;
}
int main()
{
float P = 1;
float p;
int n,tol;
printf("Please input the probability of the defective rate:");
scanf("%f",&p);
printf("Please input the number of testing the equipments:");
scanf("%d",&n);
printf("Please input the number of products per inspection:");
scanf("%d",&tol);
for(int X = 0 ; X <= 1 ; X++)
{
P -= BinDistrubution(tol,X,p);
}
// 每次检验后需要调整设备的概率为:
printf("The probability of every time we need to adjust the equipments after testing them is:%.4f\n",P);
float P_y;
P_y = n * P;
// 一天中调整设备的次数的期望
printf("The expectation of the day we adjust the equipments is :%.4f",P_y);
return 0;
}
代码分析:代码主要的难度就是在二项分布的那个公式上,需要结合组合公式的算法才行,其它的就按照做题的思路来就行了。
题目分析: 先来理解最后一句话,当 X = 1 X=1 X=1时表示1号盒子中至少有一个球,此时1为四个盒子中号码最小的那一个,当 X = 2 X=2 X=2时表示2号盒子中至少有一个球,此时2“应该为”最小号码,也就是说1号盒里就不会有元素了,当 X = 3 X=3 X=3时表示3号盒子中至少有一个球,此时3“应该”为最小号码,也就是说1和2号盒子里都没有球…
理解了最后一句话后这个题就简单了,每个球有4种放法,一共有3个球,也就是总共有 4 3 4^3 43种方法,然后若 X = 1 X=1 X=1,则 P { X = 1 } = 1 − 3 3 4 3 = 4 3 − 3 3 4 3 P\{X=1\}=1-\frac{3^3}{4^3}=\frac{4^3-3^3}{4^3} P{X=1}=1−4333=4343−33…
#include
#include
#include
// The algorithm of abbreviation ——约分的算法
void Abbreviation(int *a)
{
while(a[0] % 2 == 0 && a[1] % 2 == 0)
{
a[0] /= 2;
a[1] /= 2;
}
for(int i = 3 ;i <= a[1] / 2 ; i += 2)
{
while(a[0] % i == 0 && a[1] % i == 0)
{
a[0] /= i;
a[1] /= i;
}
}
}
// Add up the points ——分数相加
int* add(int* a,int* b)
{
if(a[0] == 0)
return b;
if(b[0] == 0)
return a;
int t = a[1];
a[1] *= b[1];
a[0] *= b[1];
a[0] += b[0] * t;
Abbreviation(a);
return a;
}
int main()
{
int ball,box;
printf("Please input the number of the balls:"); // 输入球的数量
scanf("%d",&ball);
printf("Please input the number of the box:"); // 输入盒子的数量
scanf("%d",&box);
int E_X[2] = {0};
// X denotes the random variable ——X表示随机变量
for(int X = 1 ; X <= box ; X++) // The prosibible values of X ——X可能取的值
{
int coe[2];
coe[0] = pow(box - X + 1,ball) - pow(box - X,ball);
coe[1] = pow(box,ball);
Abbreviation(coe);
printf("P{X=%d}=%d/%d\n",X,coe[0],coe[1]);
// According to the formula of the Expectation ——根据期望的公式
// x_i*p_i
coe[0] *= X;
int *t = add(E_X,coe);
E_X[0] = t[0];
E_X[1] = t[1];
}
printf("\n");
printf("The expectation of X is :%d/%d",E_X[0],E_X[1]);
return 0;
}
代码分析:还是老样子,对于一个需要用分数来表示的题,我们用一个大小为2的一维数组来分别存储它的分子和分母,然后进行相关的运算即可。
那些啥组合公式的代码、约分代码我在这类专栏的前面博客中写过,所以这里就直接拿过来用了。
X\Y | 1 | 2 |
---|---|---|
1 | 0.125 | 0.25 |
2 | 0.5 | 0.125 |
题目分析:由题知,再结合前面总结的知识点,设 g ( x , y ) = x 2 + y g(x,y)=x^2+y g(x,y)=x2+y,那么有:
则 E ( Z ) = 2 × 0.125 + 3 × 0.25 + 5 × 0.5 + 6 × 0.125 = 4.25 E(Z)=2\times 0.125+3\times 0.25+5\times 0.5+6\times0.125=4.25 E(Z)=2×0.125+3×0.25+5×0.5+6×0.125=4.25
#include
#include
#include
int main()
{
// Use an array to restore the datas of probability distrubution ——用一个数组来存储概率分布中的数据
float **D;
D = (float **) malloc (sizeof(float *) * 2);
for(int i = 0 ; i < 2 ; i++)
D[i] = (float *) malloc (sizeof(float *) * 2);
// 请按行输入概率分布的数据:
printf("Please input the values of the probability distrubution by line:\n");
for(int i = 0 ; i < 2 ; i++)
{
for(int j = 0 ; j < 2 ; j++)
{
scanf("%f",*(D + i) + j);
}
}
// E_X denotes the expectation of X ——E_X表示X的期望
float E_X = 0;
printf("\n");
// 这个概率分布为:
printf("The probability distrubution is :\n");
for(int i = 0 ; i < 2 ; i++)
{
for(int j = 0 ; j < 2 ; j++)
{
printf("%.3f ",*(*(D + i) + j));
// According to the formula of expectation ——根据期望的公式
// xi*pi
E_X += (pow(i + 1,2) + j + 1) * (*(*(D + i) + j));
}
printf("\n");
}
// X的期望为:
printf("The expectation of X is:%.2f",E_X);
return 0;
}