如何产生满足高斯分布的随机数据

问题

  • 假设随机变量z服从标准正态分布 N ( 0 , 1 ) N(0,1) N(0,1) , X = δ z + μ X = \delta z + \mu X=δz+μ。则 X X X服从均值为 μ \mu μ,方差为 δ \delta δ的高斯分布 N ( μ , δ 2 ) N(\mu,\delta^2) N(μ,δ2)

采样方法

  • 常见的采样方法有逆变换法、拒绝采样法 、重要性采样及其重采样、马尔科夫蒙特卡洛采样法等。那么高斯分布如何采样?

逆变换法

1. 直接用逆变换法

没有显式解,计算麻烦,且需要求逆。

2. Box-Muller算法
二维情况:

  • 假设x, y是两个服从标准正态分布的独立随机变量,在圆盘上满足高斯分布。得到符合标准正态分布(x,y)的采样过程为:
    1. 产生[0,1]上的两个独立的均匀分布随机数 u 1 , u 2 u_1 , u_2 u1,u2
    2. x = − 2 l n ( u 1 ) c o s 2 π u 2 x = \sqrt{-2ln(u_1)}cos2\pi u_2 x=2ln(u1) cos2πu2
      y = − 2 l n ( u 1 ) s i n 2 π u 2 y = \sqrt{-2ln(u_1)}sin2\pi u_2 y=2ln(u1) sin2πu2
  • x , y x,y xy服从标准正态分布,并且是独立的。

3. Marsaglia polar method算法

  • Box-Muller算法需要计算三角函数,相对还是比较耗时。Marsaglia polar method算法 避开了其中的三角函数的计算,速度更快。其采样过程为:
  • 二维情况:
    1. 用拒绝采样法,产生均匀分布随机数对
    2. s = x 2 + y 2 s=x^2+y^2 s=x2+y2,则 x 2 − l n s s x\sqrt{ \frac{2-lns}{s} } xs2lns y 2 − l n s s y\sqrt{ \frac{2-lns}{s} } ys2lns 是服从标准真来分布的样本。用 x s \frac{x}{\sqrt{s}} s x y s \frac{y}{\sqrt{s}} s y来代替cos和sin计算。

拒绝采样法

  • 见参考文献。

代码

代码

参考文献

Hulu机器学习问题与解答系列 | 十四:如何对高斯分布进行采样
一维正态分布随机数序列产生的方法

你可能感兴趣的:(机器学习)