概率论与数理统计学习:随机变量(二)——知识总结与C语言案例实现

hello,大家好。

这里是第四期概率论与数理统计的学习,我将用这篇博客去整理知识点以及用C语言去实现案例。
在这里插入图片描述
还是先总结一遍这期的知识点。

连续型随机变量与随机变量的分布函数

在上一期的学习中,我们总结了离散型随机变量的定义和它的概率分布,同时我们也提到了一个随机变量的概念——连续型随机变量。

在前面我们给出离散型随机变量的特点是不连续,所以连续型随机变量的特点也就是连续了。但是,最开始的时候我一直没搞懂“连续”的含义是什么,离散型随机变量哪里不连续了?连续性随机变量哪里连续了?别着急,慢慢往下看。

☁️ 概率密度函数

定义:若存在非负函数 f ( x ) f(x) f(x),使随机变量取之于任一区间 ( a , b ] (a,b] (a,b]的概率可以表示为 P { a < X ≤ b } = ∫ a b f ( x ) d x P\{aP{a<Xb}=abf(x)dx,则称 X X X连续型随机变量 f ( x ) f(x) f(x) X X X的概率密度函数,简称概率密度

从上面这段定义中,你是否能看出离散型与连续型的区别?如果把试验的结果看作一个区间的话,离散型随机变量可以说是这个区间上的某个点,而连续型随机变量就是这个区间上的一个子区间(但不能是一个点),此即“连续”。别急,继续往下看。
概率论与数理统计学习:随机变量(二)——知识总结与C语言案例实现_第1张图片
概率密度函数的性质:

  1. ∫ − ∞ + ∞ f ( x ) d x = 1 \int_{-\infty}^{+\infty}f(x)dx=1 +f(x)dx=1
  2. 对连续型随机变量 X X X和任意常数 a a a,总有 P { X = a } = 0 P\{X=a\}=0 P{X=a}=0

第一条比较好理解,第二条性质是个啥意思?

假定给定区间 [ 0 , 1 ] [0,1] [0,1],对其中任意一点 a a a,有 P { X = a } = 0.01 P\{X=a\}=0.01 P{X=a}=0.01,这么一看貌似没问题,但就这么一个小区间,也可以分成无数个点,最后加起来的概率肯定大于1,所以才有了性质2。

但性质2同时也说明: P ( A ) = 0 P(A)=0 P(A)=0,并不可能推出 A A A是不可能事件,因为在这里虽然 P { X = a } = 0 P\{X=a\}=0 P{X=a}=0,但事件 { X = a } \{X=a\} {X=a}并非不可能事件。

于是,连续型随机变量 X X X落在区间 ( a , b ) , ( a , b ] , [ a , b ) , [ a , b ] (a,b),(a,b],[a,b),[a,b] (a,b),(a,b],[a,b),[a,b]上的概率都相等,即 P { a < X < b } = P { a ≤ X < b } = P { a < X ≤ b } = P { a ≤ X ≤ b } P\{aP{a<X<b}=P{aX<b}=P{a<Xb}=P{aXb}

☁️ 常见的连续型随机变量的概率密度函数

☀️ 均匀分布

如果随机变量 X X X的概率密度函数为 f ( x ) = { 1 b − a ,      a ≤ x ≤ b 0 ,         其它 f(x)=\begin{cases} \frac1{b-a},~~~~a\leq x\leq b\\ 0,~~~~~~~~其它 \end{cases} f(x)={ba1,    axb0,        其它
则称 X X X服从 [ a , b ] [a,b] [a,b]区间上的均匀分布,记作 X X X~ U [ a , b ] U[a,b] U[a,b] U U U取自Uniform,均匀)。

对于任意长度为 l l l的子区间 [ c , c + l ] , a ≤ c < c + l ≤ d [c,c+l],a\leq c[c,c+l],ac<c+ld,有 P { c ≤ X ≤ c + l } = ∫ c c + l f ( x ) d x = l b − a P\{c\leq X\leq c+l\}=\int_{c}^{c+l}f(x)dx=\frac{l}{b-a} P{cXc+l}=cc+lf(x)dx=bal

☀️ 指数分布

如果随机变量 X X X的概率密度函数为 f ( x ) = { λ e − λ x , x ≥ 0 0 ,          x < 0 f(x)=\begin{cases} \lambda e^{-\lambda x},x\geq 0\\ 0,~~~~~~~~x<0 \end{cases} f(x)={λeλx,x00,        x<0
其中 λ > 0 \lambda>0 λ>0为常数,则称 X X X服从参数为 λ \lambda λ的指数分布。指数分布是最常用的寿命分布。
∫ − ∞ + ∞ f ( x ) d x = ∫ − ∞ + ∞ λ e − λ x d x = 1 \int_{-\infty}^{+\infty}f(x)dx=\int_{-\infty}^{+\infty}\lambda e^{-\lambda x}dx=1 +f(x)dx=+λeλxdx=1

☀️ 正态分布

设随机变量 X X X的概率密度函数为 f ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 ,      − ∞ < x < + ∞ f(x)=\frac{1}{\sqrt[]{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma ^2}},~~~~-\inftyf(x)=2π σ1e2σ2(xμ)2,    <x<+

其中, μ , σ \mu,\sigma μ,σ为常数,则称 X X X服从参数为 μ , σ \mu,\sigma μ,σ的正态分布或高斯分布,记为 X X X~ N ( μ , σ 2 ) N(\mu,\sigma ^2) N(μ,σ2),这里 N N N取自Normal。

正态分布的概率密度函数 f ( x ) f(x) f(x)图如下:
概率论与数理统计学习:随机变量(二)——知识总结与C语言案例实现_第2张图片
它有如下性质:

关于直线 x = μ x=\mu x=μ对称

x = μ x=\mu x=μ处取得最大值 1 2 π σ \frac{1}{\sqrt[]{2\pi}\sigma} 2π σ1

x = + ‾ σ x=\underline +\sigma x=+σ处有拐点

∣ x ∣ → + ∞ |x|\rightarrow+\infty x+时,曲线以 x x x轴为渐近线

特别地,称参数 μ = 0 , σ = 1 \mu=0,\sigma=1 μ=0,σ=1的正态分布 N ( 0 , 1 ) N(0,1) N(0,1)为标准正态分布,其概率密度函数通常用 ψ ( x ) \psi(x) ψ(x)来表示,即 ψ ( x ) = 1 2 π e − x 2 2 , − ∞ < x < + ∞ \psi(x)=\frac{1}{\sqrt[]{2\pi}}e^{-\frac{x^2}{2}},-\infty ψ(x)=2π 1e2x2,<x<+
此外,记 ϕ ( x ) = 1 2 π ∫ − ∞ x e − t 2 2 d t , − ∞ < x < + ∞ \phi(x)=\frac1{\sqrt[]{2\pi}}\int_{-\infty}^xe^{-\frac{t^2}2}dt,-\inftyϕ(x)=2π 1xe2t2dt,<x<+
ψ ( x ) \psi(x) ψ(x)的对称性,可推出 ϕ ( x ) \phi(x) ϕ(x)的如下性质: ϕ ( − x ) = 1 − ϕ ( x ) \phi(-x)=1-\phi(x) ϕ(x)=1ϕ(x)

定理:

若随机变量 X X X~ N ( μ , σ 2 ) N(\mu,\sigma ^2) N(μ,σ2),则对任意 a , b ( a < b ) a,b(aa,b(a<b),有 P { a < X ≤ b } = ϕ ( b − μ σ ) − ϕ ( a − μ σ ) P\{a< X\leq b\}=\phi(\frac{b-\mu}\sigma)-\phi(\frac{a-\mu}\sigma) P{a<Xb}=ϕ(σbμ)ϕ(σaμ)

☁️ 随机变量的分布函数

定义:

X X X是一随机变量,称函数 F ( x ) = P { X ≤ x } , − ∞ < x < + ∞ F(x)=P\{X\leq x\},-\infty F(x)=P{Xx},<x<+ X X X的分布函数。

随机变量的分布函数有如下性质:

对任意实数 a < b aa<b,总有 F ( a ) ≤ F ( b ) F(a)\leq F(b) F(a)F(b),并且 P { a < X ≤ b } = F ( b ) − F ( a ) P\{aP{a<Xb}=F(b)F(a)

对任意实数 x x x,总有 0 ≤ F ( x ) ≤ 1 0\leq F(x)\leq 1 0F(x)1,且 F ( − ∞ ) = lim ⁡ x → − ∞ F ( x ) = 0 , F ( + ∞ ) = lim ⁡ x → + ∞ F ( x ) = 1 F(-\infty)=\displaystyle\lim_{x\to-\infty}F(x)=0,F(+\infty)=\displaystyle\lim_{x\to+\infty}F(x)=1 F()=xlimF(x)=0,F(+)=x+limF(x)=1

P { X < a } = F ( a − 0 ) P\{XP{X<a}=F(a0) a − 0 a-0 a0表示从左逼近 a a a,但不包含 a a a

P { X > a } = 1 − P { X ≤ a } = 1 − F ( a ) P\{X>a\}=1-P\{X\leq a\}=1-F(a) P{X>a}=1P{Xa}=1F(a)

P { X = a } = F ( a ) − F ( a − 0 ) P\{X=a\}=F(a)-F(a-0) P{X=a}=F(a)F(a0)

注意❗️上面的分布函数适用于离散型和连续型,只有连续型随机变量中,开闭区间才等同。

离散型随机变量 X X X,由概率的可加性可得 F ( x ) = P { X ≤ x } = ∑ x k ≤ x P { X = x k } F(x)=P\{X\leq x\}=\sum_{x_{k}\leq x}P\{X=x_{k}\} F(x)=P{Xx}=xkxP{X=xk}

基础知识预备完毕,下面开始C语言案例实现!
在这里插入图片描述

C语言案例实现

在开始之前,先实现三种常见的连续型随机变量的概率密度函数的算法。

均匀分布:

#include 
#include 
// we assume that c,d,must be in the section [a,b] and c <= d
// 我们假定c,d一定在区间[a,b]中且一定有c<=d
void UniDistrubution(float a,float b,float c,float d)
{
	// for continuous random variables
	if(c == d)
	{
		printf("The possibility of the incident you expect is 0.");
		exit(0);
	}
	float PX;
	PX = (d - c) / (b - a);
	printf("The possibility of the incident X is :%f",PX);
}
int main()
{
	UniDistrubution(-2,4,3,4);
	return 0;
}

概率论与数理统计学习:随机变量(二)——知识总结与C语言案例实现_第3张图片
指数分布:

设某电子管的使用寿命 X X X(单位:小时)服从参数 λ = 0.0002 \lambda=0.0002 λ=0.0002的指数分布。求电子管的使用寿命超过3000小时的概率。

#include 
#include 
#include 
float Figure_e(int n)
{
	float e = 1;
	int sum = 1;
	for(int i = 1 ; i <= n ; i++)
	{
		sum *= i;
		e += 1.0 / sum;
	}
	return e;
}

// x1 denotes the lower limit of integral ——x1代表积分下限
// x2 denotes the upper limit of integral ——x2代表积分上限
// w denotes the parameter λ ——w代表参数λ
float ExDistrubution(float x1,float x2,float w)
{
	// X1 denotes the value that the lower limit brings in when the function is integrated ——X1表示函数被积分后下限带进去的值
	// X2 is the same ——X2同理
	float X1,X2;
	if(x1 < 0 || x2 < 0)
	{
		printf("The possibility of the incident you expect is 0.");
		exit(0);
	}
	// e denotes the natural number e ——e表示自然数e
	float e = Figure_e(10);
	X1 = pow(e,-w*x1);
	// 32767 denotes positive infinity ——32767表示正无穷
	if(x2 == 32767)
		X2 = 0;
	else
		X2 = pow(e,-w*x2);
	float PX = X1 - X2;
	return PX;	
}

int main()
{
	float x1 = 3000;
	float x2 = 32767;
	float w = 0.0002;
	float P = ExDistrubution(x1,x2,w);
	printf("%.4f",P);
	return 0;
}

概率论与数理统计学习:随机变量(二)——知识总结与C语言案例实现_第4张图片
这些值都是我用书上例题带进去的!!

正态分布

因为正态分布涉及到对 e − t 2 2 e^{-\frac{t^2}2} e2t2的求积分,而它的原函数是求不出来的,需要做一些变化。em…也就是用C语言实现起来很困难,所以这里对于正态分布的题就直接查表即可。标准正态分布表如下(横纵坐标都是 x x x):
ϕ ( x ) = ∫ − ∞ x 1 2 π e − u 2 2 d u \phi(x)=\int_{-\infty}^x\frac1{\sqrt[]{2\pi}}e^{-\frac{u^2}{2}}du ϕ(x)=x2π 1e2u2du
概率论与数理统计学习:随机变量(二)——知识总结与C语言案例实现_第5张图片
已知某台机器生产的螺栓长度 X X X(单位:厘米)服从参数 μ = 10.05 , σ = 0.06 \mu=10.05,\sigma=0.06 μ=10.05,σ=0.06的正态分布。规定螺栓长度在 10.05 + ‾ 0.12 10.05\underline +0.12 10.05+0.12内为合格产品,试求螺栓为合格品的概率。

假设 X X X~ N ( 10.05 , 0.0 6 2 ) N(10.05,0.06^2) N(10.05,0.062),记 a = 10.05 − 0.12 , b = 10.05 + 0.12 a=10.05-0.12,b=10.05+0.12 a=10.050.12,b=10.05+0.12。又因为正态分布是连续型随机变量的概率密度函数,所以开闭区间都一样,就有 P { a ≤ X ≤ b } = P { a < X ≤ b } P\{a\leq X\leq b\}=P\{aP{aXb}=P{a<Xb}

于是:

P { x < X ≤ b } P\{xP{x<Xb}
= ϕ ( b − μ σ ) − ϕ ( a − μ σ ) =\phi(\frac{b-\mu}{\sigma})-\phi(\frac{a-\mu}{\sigma}) =ϕ(σbμ)ϕ(σaμ)
= ϕ ( 2 ) − ϕ ( − 2 ) =\phi(2)-\phi(-2) =ϕ(2)ϕ(2)
= ϕ ( 2 ) − [ 1 − ϕ ( 2 ) ] =\phi(2)-[1-\phi(2)] =ϕ(2)[1ϕ(2)]
= 2 ϕ ( 2 ) − 1 =2\phi(2)-1 =2ϕ(2)1

再根据商标可知,当 x = 2 x=2 x=2时, ϕ ( x ) = 0.9772 \phi(x)=0.9772 ϕ(x)=0.9772。所以答案也就显而易见了。

  1. 某种元件的寿命 X X X(单位:小时)的概率密度函数为:
    f ( x ) = { 1000 x 2 , x ≥ 1000 0       , x < 1000 f(x)=\begin{cases} \frac{1000}{x^2},x\geq 1000\\ 0~~~~~,x<1000\\ \end{cases} f(x)={x21000,x10000     ,x<1000
    求5个元件在使用1500小时后,恰有2个元件失效的概率。

分析:有两个元件在使用1500小时后失效,也就是它们的使用寿命不超过1500小时。这里不需要考虑它们使用寿命小于1000的情况,因为小1000的概率为0。所以,我们首先需要求的是一个元件使用寿命在1000~1500的概率。
∫ 1000 1500 f ( x ) d x = ? \int_{1000}^{1500}f(x)dx=? 10001500f(x)dx=?

#include 
float AfIntegral(float x)
{
	// the integrated function ——积分后的函数
	x = -1000 / x;
	return x;
}
int main()
{
	float p;
	p = AfIntegral(1500) - AfIntegral(1000);
	printf("%f",p);
	return 0;
}

在这里插入图片描述
然后这个题就变成了一个离散型随机变量的二项分布:

#include 

float AfIntegral(float x)
{
	x = -1000 / x;
	return x;
}

// 组合算法
int Combination(int n,int m)
{
	int sum = 1,p = 1;
	for( ; m > 0 ; m--)
	{
		sum *= n--;
		p *= m;
	}
	return sum/p;
}

// 二项分布算法
float BinDistrubution(int n,int k,float p)
{
	float _P;
	_P = Combination(n,k);
	for(int i = 0 ; i < k ; i++)
		_P *= p;
	for(int i = 0 ; i < n - k ; i++)
		_P *= (1 - p);
	return _P;
}

int main()
{
	float p;
	p = AfIntegral(1500) - AfIntegral(1000);
	float _P = BinDistrubution(5,2,p);
	printf("%f",_P);
	return 0;
}

概率论与数理统计学习:随机变量(二)——知识总结与C语言案例实现_第6张图片
这个概率呢也就是 80 243 \frac{80}{243} 24380,做题中一般没有化成小数。

  1. 设某地区每天的用电量 X X X(单位:百万千瓦·时)是一连续型随机变量,概率密度函数为 f ( x ) = { 12 x ( 1 − x ) 2 , 0 < x < 1 0                    , 其它 f(x)=\begin{cases} 12x(1-x)^2,0f(x)={12x(1x)2,0<x<10                  ,其它
    假设该地区每天的供电量仅有80万瓦·时,求该地区每条供电量不足的概率。若每条上升到90万千瓦·时,每天供电量不足的概率是多少?

分析1):首先要注意题目给出的单位!!一个是百万瓦,一个是万瓦,记得换算!!

什么叫供电量不足?我们只有80的供电量,但我们一天至少要100的供电量,这就是不足,也就是 0 < x < 0.8 00<x<0.8的情况。这个题相较于上面那个题就只根据概率密度函数求一个概率就是了。

#include 
#include 
// 这个函数是题目中函数积分后的算法
float AfIntegral(float x)
{
	float a = 3 * pow(x,4);
	a -= 8 * pow(x,3);
	a += 6 * pow(x,2);
	return a;
}

int main()
{
	float p = AfIntegral(1) - AfIntegral(0.8);
	printf("%f",p);
	return 0;
}
  1. 第二问呢只需要改变一下积分区间即可:
#include 
#include 
float AfIntegral(float x)
{
	float a = 3 * pow(x,4);
	a -= 8 * pow(x,3);
	a += 6 * pow(x,2);
	return a;
}

int main()
{
	float p = AfIntegral(1) - AfIntegral(0.9);
	printf("%f",p);
	return 0;
}
  1. 20件同类型的产品中有2件次品,其余为正品。今从这20件产品中任意抽取4次,每次只取一件,取后不放回。以 X X X表示4次共取出次品的件数,求 X X X的概率分布与分布函数。

分析:概率分布就是列一张表,列出抽到或没抽到次品的概率。分布函数是随机变量的分布函数。嗯…上一次这么解释还是在上一次啊
概率论与数理统计学习:随机变量(二)——知识总结与C语言案例实现_第7张图片
好吧,分布函数,就是随机变量分布在一个区间内的概率。

首先, X X X的取值有3种可能,分别是0,1,2

#include 
// 约分函数
void Abbreviation(long int *a)
{
	while(a[0] % 2 == 0 && a[1] % 2 == 0)
	{
		a[0] /= 2;
		a[1] /= 2;
	}
	
	for(int i = 3 ;i < a[1] / 2 ; i += 2)
	{
		while(a[0] % i == 0 && a[1] % i == 0)
		{
			a[0] /= i;
			a[1] /= i;
		}
	}
}

int Combination(int n,int m)
{
	int sum = 1,p = 1;
	for( ; m > 0 ; m--)
	{
		sum *= n--;
		p *= m;
	}
	return sum/p;
}

int main()
{
	// the number of the quality goods ——正品的数量
	int real = 18;
	// the number of the defective goods ——次品的数量
	int fake = 2;
	// the number of the defective goods I've extracted ——每次抽到次品的数量
	int pos = 0;
	for(int i = 0 ; i < 3 ; i++)
	{
		// the target to use the array is to do the reduction of a fraction ——用数组是为了方便后面的约分
		long int a[2];
		a[0] = Combination(real,4 - pos) * Combination(fake,pos);
		a[1] = Combination(real + fake,4);
		Abbreviation(a);
		printf("The possibility of X=%d is : %d/%d\n",i,a[0],a[1]);
		pos++;
	}
	return 0;
}

概率论与数理统计学习:随机变量(二)——知识总结与C语言案例实现_第8张图片
然后就是求它的分布函数,由于涉及到分数形式的概率相加,还需要通分,也就是得要有一个通分函数啊
在这里插入图片描述


X X X的取值可知,我们可以将它的取值划分为4个区间,分别是:
x < 0 x <0 x<0
0 ≤ x < 1 0\leq x<1 0x<1
1 ≤ x < 2 1\leq x<2 1x<2
2 ≤ x 2\leq x 2x
注意这里 x x x X X X的区别。现在可以往上翻再看看分布函数的概念。例如,当 1 ≤ x < 2 1\leq x<2 1x<2时, F ( x ) = P { X ≤ x } F(x) = P\{X\leq x\} F(x)=P{Xx},也就是 F ( x ) F(x) F(x)等于小于 x x x的所有 X X X的概率之和。即上面条件下, F ( x ) = P { X = 0 } + P { X = 1 } F(x)=P\{X= 0\}+P\{X=1\} F(x)=P{X=0}+P{X=1}

那么进而:

#include 
// 约分函数
void Abbreviation(long int *a)
{
	while(a[0] % 2 == 0 && a[1] % 2 == 0)
	{
		a[0] /= 2;
		a[1] /= 2;
	}
	
	for(int i = 3 ;i < a[1] / 2 ; i += 2)
	{
		while(a[0] % i == 0 && a[1] % i == 0)
		{
			a[0] /= i;
			a[1] /= i;
		}
	}
}

int Combination(int n,int m)
{
	int sum = 1,p = 1;
	for( ; m > 0 ; m--)
	{
		sum *= n--;
		p *= m;
	}
	return sum/p;
}

int main()
{
	// the number of the quality goods ——正品的数量
	int real = 18;
	// the number of the defective goods ——次品的数量
	int fake = 2;
	// the number of the defective goods I've extracted ——每次抽到次品的数量
	int pos = 0;
	int j = 0;
	long int a[6];
	for(int i = 0 ; i < 3 ; i++)
	{
		// the target to use the array is to do the reduction of a fraction ——用数组是为了方便后面的约分
		a[j++] = Combination(real,4 - pos) * Combination(fake,pos);
		a[j++] = Combination(real + fake,4);
		Abbreviation(a + i * 2);
		pos++;
	}
	j = 0;
	// use array b to record the score ——用数组b来记录分数(每个概率)
	long int b[2] = {0};
	int k = 3;
	while(j <= 3)
	{
		if(b[0] == 0)
		{
			printf("x < %d : %d\n",j++,b[0]);
			b[0] += a[0];
			b[1] += a[1];
			printf("x < %d : %d/%d\n",j++,b[0],b[1]);
			continue;
		}
		int n = b[1];
		b[1] *= a[k];
		b[0] *= a[k];
		b[0] += a[k - 1] * n;
		Abbreviation(b);
		if(j == 3)
		{
			printf("2 <= x : %d/%d",b[0],b[1]);
			j++;
			continue;
		}
		printf("x < %d : %d/%d\n",j++,b[0],b[1]); 
		k += 2;
	}
	return 0;
}

概率论与数理统计学习:随机变量(二)——知识总结与C语言案例实现_第9张图片
好啦这期学习就到这里了,下期,如有不足之处,希望大家能多多指正
概率论与数理统计学习:随机变量(二)——知识总结与C语言案例实现_第10张图片

你可能感兴趣的:(概率论与数理统计学习,概率论,学习,c语言)