Pólya urn model翻译

在统计学中,以乔治·波利亚命名的Pólya瓮模型(也称为Pólya瓮方案或简称为Pólya瓮)是一种统计模型,用作理想化的心理锻炼(mental exercise)框架,统一了许多治疗方法。
  步骤:在瓮模型中,物体(例如原子,人,汽车等)在瓮或其他容器中被表示为彩色的球。在基本的Pólya瓮模型中,容器中包含 x x x个白色和 y y y个黑色球;从容器中随机抽取一个球并观察其颜色; 然后将其放回到容器中,并将另一个相同颜色的球添加到容器中,并重复选择过程。其中,有趣的问题是容器里面球的演变和抽出的球的颜色顺序。
  这赋予容器一种自我强化的性质,有时表现为“富者愈富”。
  请注意,在某种意义上,Pólya瓮模型是不重复抽样(或无放回抽样,sampling without replacement)模型的“对立面”。在不重复抽样中,每次观察到特定值时,不可能再次观察到该值,而在Pólya瓮模型中观察到价值更有可能再次被观察到。 在这两种模型中,当前测量行为都会影响未来测量的结果。与前两种模型相比,当进行重复抽样(或有放回抽样,sampling with replacement),观察特定值对再次观察该值的可能性是没有影响的。另请注意,在Pólya瓮模型中,随着时间的推移,持续的测量行为对未来测量的影响越来越小,而在不重复抽样中,情况恰恰相反:在对特定值进行一定数量的测量之后,将永远不会再看到该值。
  对这个设计巧妙的Pólya瓮模型感兴趣的原因之一是它提供了一个样例,容器中球的数目的改变(最初 x x x个白色和 y y y个黑色球)不是未知的,其能够近似地更新适合于初始的未知球的数目的不同情况的主观概率,同时进行普通的重复抽样。由于在第二种情况下简单的“重复抽样”方案,容器中球的数目是静态的,但是可通过假设观察者现在不知道模型中球的数目来补偿这种更大的简单性。使用(共轭)先验分布的特定选择,可以对观察者关于容器初始含量的不确定性进行贝叶斯分析(Bayesian analysis)。
  具体地说,假设一个观察者知道容器仅包含相同大小的球,每个球要么是黑色或是白色,但是他不知道容器中存在球的数量,也不知道每种颜色的比例。假设他对这些未知有先验信念:对于他来说,容器内容的概率分布很好地通过容器中球的总数的先验分布来近似,并且对于这些黑球的初始比例,具有参数 ( x , y ) (x,y) (xy)的β先验分布,这个比例(对他来说)被认为几乎独立于总数。然后,从容器中连续的抽签结果的过程(有替换但没有重复)具有与上述Pólya方案大致相同的概率律,其中实际容器的内容并没有隐藏。这里的近似误差(approximation error)涉及这样一个事实,即包含已知有限数量m球的容器不能具有黑球未知比例的完全β分布,因为该比例的可能值的范围被限制为 1 / m 1/m 1/m的倍数,而不是完全自由地在连续单位间隔中假设任何值,正如β分布的比例一样。这个略微非正式的解释是出于动机的原因而提供的,并且可以在数学上更加精确。
  这个基本的Pólya urn model已经在很多方面得到了丰富和概括。

1.Pólya瓮相关的分布

  • beta-二项分布:成功抽取(试验)次数的分布,例如: 从容器中抽取 n n n次,白球抽取次数的概率分布。
  • Dirichlet-multiinomial分布(也称为多元Pólya分布):每种颜色的球数分布,给定 n n n个来自Pólya瓮中的球,其中有 k k k种不同的颜色而不是只有两种颜色。
  • martingales,Beta二项分布和 β \beta β分布:设 w w w b b b是白球和黑球在容器中的初始数目,并且令 w + n w w+n_w w+nw为在抽取n次球以后容器中白球的数目。然后, n = 1 , 2 , 3 , … n=1,2,3,\dots n=1,2,3,的值序列 w + n w w + b + n \frac{w+n_w}{w+b+n} w+b+nw+nw是Beta二项分布的归一化版本。 当 n → ∞ 时 n\to\infty时 n,它是一个martingale并收敛到 β \beta β分布。
  • 狄利克雷过程,中餐馆过程,Hoppe urn:想象一个修改后的Pólya瓮方案如下。 我们从一个带有 α \alpha α个黑球的容器开始。 当从容器中抽出一个球时,如果我们得到一个黑球,将球放回并再放回一个新的非黑色球,这个球是从无限可用颜色的均匀分布中随机生成的,并考虑新生成的颜色在原有容器中不存在。否则,将球放回另一个相同颜色的球,就像标准的Pólya瓮方案一样。来自这个改良的Pólya瓮方案的无限连续得到的球的颜色遵循中餐馆过程。如果我们不是生成新颜色,而是从给定的基本分布中绘制一个随机值,并使用该值来标记球,则无限序列绘制的标签遵循狄利克雷过程。
  • Moran模型:用于模拟理论群体遗传学中遗传漂变的骨灰盒模型。这与Pólya骨灰盒模型非常相似,不同之处在于,除了添加相同颜色的新球之外,还会从骨灰盒中移除随机抽取的球。因此,瓮中的球数保持不变。然后继续采样最终导致一个颜色为所有球的骨灰盒,每种颜色的概率是原始骨灰盒中该颜色的比例。有一些Moran模型的变种,坚持从球洞中取出的球是与该步骤中最初采样的球不同的球,以及在新球放入球后立即移除球的变体,以便 新球是可以移除的球之一。这使得达到所有球是相同颜色的状态所花费的时间差别很小。Moran过程模拟了具有重叠世代的群体中的遗传漂变。

原文:https://en.wikipedia.org/wiki/Pólya_urn_model

你可能感兴趣的:(基础-随机过程)