蒙特卡洛方法求解定积分有两种方法,一种是上一节中讲的投点法,另外一种是期望法(也称平均值法)。
给出如下曲线 f ( x ) f(x) f(x),求 f ( x ) f(x) f(x)在 a , b a,b a,b上的积分,即 x x x在 a , b a,b a,b上与曲线 f ( x ) f(x) f(x)围成的面积。随机在如下矩形中进行投点,假设绿色点数为 g g g,红色点数为 r r r,矩阵的面积为 A A A,则绿色部分的面积 S S S就是:
S = A ∗ g r + g S = A*\frac{g}{r+g} S=A∗r+gg
注意,蒙特卡罗方法所求的数值是一个近似值,而不是精确值。
统计学中期望描述了随机变量的平均取值的大小特征,计算期望过程:试验中每次可能结果的概率值乘以其结果的总和,也就是数值乘以其发生的概率的和。理解无意识统计学家定律就是告诉我们,事件万物相互之间是有相互联系的,一个事件的发生概率一定程度上可以用另一个事件的发生概率进行描述,比如函数 F ( X ) = ( X − 3 ) 2 F(X) = (X-3)^2 F(X)=(X−3)2中, X X X是一个随机变量, X X X的概率密度函数是影响到 F ( X ) F(X) F(X)取值的概率密度函数的。
无意识统计学加定律,则是告诉已知随机变量 X X X的概率分布 f x ( x ) f_x(x) fx(x),但不知道 g ( X ) g(X) g(X)的分布,此时用LOTUS公式能计算出函数 g ( X ) g(X) g(X)的数学期望。
X X X是离散分布时
E [ g ( X ) ] = ∑ x g ( X ) f x ( x ) E[g(X)] = \sum_xg(X)f_x(x) E[g(X)]=x∑g(X)fx(x)
X X X是连续分布时
E [ g ( X ) ] = ∫ g ( X ) f x ( x ) d x E[g(X)] = \int g(X)f_x(x)dx E[g(X)]=∫g(X)fx(x)dx
还是上边的例子,我们用期望法求解曲线的面积。
任意选取一组独立的、同分布的随机变量 X i {X_i} Xi, X i {X_i} Xi在 [ a , b ] [a,b] [a,b]上服从分布律 f x f_x fx,也就是说 f x f_x fx是随机变量 X X X的概率密度函数(PDF)或者PMF。令:
g ∗ ( x ) = g ( x ) f x ( x ) g^*(x) = \frac{g(x)}{f_x(x)} g∗(x)=fx(x)g(x)
则 g ∗ ( x ) g^*(x) g∗(x)也是一组独立同分布的随机变量。因为 g ∗ ( x ) g^*(x) g∗(x)是 x x x的函数,所以,根据LOTUS得:
E [ g ∗ ( X i ) ] = ∫ a b g ∗ ( x ) f x ( x ) d x = ∫ a b g ( x ) d x = I E[g^*(X_i)] = \int_a^b g^*(x)f_x(x)dx = \int_a^b g(x)dx = I E[g∗(Xi)]=∫abg∗(x)fx(x)dx=∫abg(x)dx=I
由强大数定理知:
P r ( lim N → ∞ 1 N ∑ g ∗ ( X i ) = I ) = 1 P_r(\lim_{N \to \infty} \frac{1}{N} \sum g^*(X_i) = I) = 1 Pr(N→∞limN1∑g∗(Xi)=I)=1
上式理解为所有概率值和为1.
假设若计算的积分有如下形式:
I = ∫ a b g ( x ) d x I = \int_a^b g(x)dx I=∫abg(x)dx
其中,被积函数 g ( x ) g(x) g(x)在区间 [ a , b ] [a,b] [a,b]内可积,任意选择一个有简便方法可以抽样的函数 f x ( x ) f_x(x) fx(x),满足以下条件:
{ f x ( x ) ≠ 0 ( a ≤ x ≤ b ) , g ( x ) ≠ 0 ∫ a b g ( x ) d x = 1 \begin{cases} f_x(x) \neq 0& (a \le x \le b),g(x)\neq 0\\ \int_a^b g(x)dx=1& \\ \end{cases} {fx(x)=0∫abg(x)dx=1(a≤x≤b),g(x)=0
记:
g ∗ ( x ) = { g ( x ) f x ( x ) , f x ( x ) ≠ 0 0 , f x ( x ) = 0 g^*(x) = \begin{cases} \frac{g(x)}{f_x(x)} &,f_x(x)\neq 0\\ 0,& f_x(x) = 0\\ \end{cases} g∗(x)={fx(x)g(x)0,,fx(x)=0fx(x)=0
那么原积分可以写成:
I = ∫ a b g ∗ ( x ) f x ( x ) d x I=\int_a^b g^*(x)f_x(x)dx I=∫abg∗(x)fx(x)dx
计算积分的步骤为:
- 产生服从分布 f x ( x ) f_x(x) fx(x)的随机变量 X i , i = 1 , 2 , 3... N X_i,{i=1,2,3...N} Xi,i=1,2,3...N
- 计算均值
I ∗ = 1 N ∑ 1 N g ∗ ( X i ) I^*=\frac{1}{N} \sum_1^N g^*(X_i) I∗=N11∑Ng∗(Xi)
将 I ∗ I^* I∗作为 I I I的近似值。
如果 a , b a,b a,b为有限值,取 f x ( x ) f_x(x) fx(x)为均匀分布
f x ( x ) = { 1 b − a , a ≤ x ≤ b 0 , o t h e r w i s e f_x(x) = \begin{cases} \frac{1}{b-a} &,a \le x \le b\\ 0,& otherwise\\ \end{cases} fx(x)={b−a10,,a≤x≤botherwise
则:
I = ∫ a b g ( x ) d x = ( b − a ) ∗ 1 b − a ∫ a b g ( x ) d x = ( b − a ) ∫ a b g ( x ) 1 b − a d x I=\int_a^b g(x)dx = (b-a) * \frac{1}{b-a}\int_a^b g(x)dx=(b-a)\int_a^b g(x)\frac{1}{b-a}dx I=∫abg(x)dx=(b−a)∗b−a1∫abg(x)dx=(b−a)∫abg(x)b−a1dx
计算积分的步骤为:
- 产生服从均匀分布 f x ( x ) f_x(x) fx(x)的随机变量 X i , i = 1 , 2 , 3... N X_i,{i=1,2,3...N} Xi,i=1,2,3...N
- 计算均值
I ∗ = b − a N ∑ 1 N g ( X i ) I^*=\frac{b-a}{N} \sum_1^N g(X_i) I∗=Nb−a1∑Ng(Xi)
将 I ∗ I^* I∗作为 I I I的近似值。
给出如下问题,如图所示:已知曲线 f ( x ) f(x) f(x),求
F = ∫ a b f ( x ) d x F=\int_a^b f(x)dx F=∫abf(x)dx
以上问题,即求解阴影部分的面积。这里,我们使用一种近似的方法来求积分,任意选取 a , b a,b a,b之间的一点 x x x,函数值为 f ( x ) f(x) f(x),则阴影部分的面积约等于:
S = f ( x ) ∗ ( b − a ) S=f(x)*(b-a) S=f(x)∗(b−a)
以上随机选取了一个点,如果随机选取4个点,那我们分别计算4个面积,然后取平均值,作为阴影部分的面积,如下图所示:
我们选取的点越多,计算出来的值也就越接近真实值。假设随机选取 N N N个点,则根据以上,我们可以得出:
S = 1 N ∑ 1 N f ( x i ) ∗ ( b − a ) = b − a N ∑ 1 N f ( x i ) S=\frac{1}{N} \sum_1^N f(x_i)*(b-a) = \frac{b-a}{N} \sum_1^N f(x_i) S=N11∑Nf(xi)∗(b−a)=Nb−a1∑Nf(xi)
当然,这也是一种近似方法。