随机游走(Random Walk)模型详解:历史||数学表示||物理意义

  • 随机游走

随机游走(Random Walk,缩写为 RW),是一种数学统计模型,它是一连串的轨迹所组成,其中每一次都是随机的。它能用来表示不规则的变动形式,如同一个人酒后乱步,所形成的随机过程记录。

1905年,由卡尔·皮尔逊首次提出。

随机游走的形式有:

  1. 马尔可夫链或马可夫过程
  2. 醉汉走路(drunkard’s walk)
  3. 莱维飞行(Lévy flight)

随机游走(random walk)矩阵可以看做是马尔科夫链的一种特例。

喝醉的酒鬼总能找到回家的路,喝醉的小鸟则可能永远也回不了家。

一维、二维随机游走过程中,只要时间足够长,我们最终总能回到出发点;

三维网格中随机游走,最终能回到出发点的概率只有大约 34%;

四维网格中随机游走,最终能回到出发点的概率是 19.3% ;

八维空间中,最终能回到出发点的概率只有 7.3% ;

定理是著名数学家波利亚(George Pólya)在 1921 年证明的。

  • 物理意义

随机游走是现实生活中常见的一种模型:

气体分子的运动、滴入水中的墨水 、气味的扩散、醉汉行走轨迹、花粉的布朗运动、证券的涨跌、抛硬币…

  1. 物理学、化学:Random Walk是扩散过程的基础模型。
  2. 统计领域:马尔可夫链蒙特卡罗,解决近似计算问题。
  3. 信息检索

早期搜索引擎如Yahoo使用的是关键字匹配技术,性能容易受到关键词频率的欺骗,所以搜索效果不是很好。

1998年Jon Kleinberg 提出了HITS算法,Sergey Brin 和 Larry Page 提出了 PageRank算法之后,搜索的正确率就得到了巨大的改观,这两种技术都是基于Random Walk。

  1. 经济学:证券的涨跌
  • Reference

  1. 维基百科
  2. 火星十一郎
  3. 数学中竟然还有这样的定理!

你可能感兴趣的:(小白学机器学习)