Polya 定理
A drunk man will find his way home, but a drunk bird may get lost forever.
-- Shizuo Kakutani
随机游动里面最著名的结论毫无疑问是下面的 Polya 定理:
$\mathbb{Z}^d$ 上的简单随机游动在 $d=1,2$ 时是常返的,在 $d\geq3$ 时都是暂态的。
罪犯的自由
假设在 $\mathbb{Z}^d$ 上,原点的位置有一座监狱,一个罪犯从监狱里逃了出来,但他不认识外面的路,所以他一出监狱就开始作简单随机游动:每次以等概率 $\frac{1}{2d}$ 走到相邻的格点上。一旦他走回监狱(原点)就会立刻被捉住处死,而如果他走出 $[-n,n]^d$ 的范围就可以获得自由,这里 $n$ 是事先给定的一个正整数。问题是:罪犯获得自由的概率是多少?
这个问题与 Polya 定理有何关系?设 $p_n$ 为罪犯获得自由的概率,显然随着 $n$ 增大,$p_n$ 是单调递减的(罪犯需要走的更远才能获得自由),因此极限 $p_\infty=\lim_{n\to\infty}p_n$ 存在。这个 $p_\infty$ 不是别的,正是 $\mathbb{Z}^d$ 上从原点出发的简单随机游动永不返回原点的概率,因此如果 $p_\infty>0$ 则此随机游动以正概率永不会到原点,从而是暂态的;反之如果 $p_\infty=0$ 则此随机游动以概率 1 返回原点,从而是常返的。
蚂蚁找食物
再来看一个与随机游动有关的问题,虽然它的表述并不难,但是仔细想想,还真有点无从下手的感觉:
考虑一张 $n\times n$ 个顶点的网格图,一只蚂蚁住在左下角的点 $a$ 处,右上角的点 $z$ 处放置有食物。现在蚂蚁从 $a$ 点出发开始作随机游动(每次随机地选择一个方向,然后沿此方向移动到相邻的点)。一旦它到达 $z$ 点获得食物则过程结束。
问题是:
蚂蚁平均需要多少步才能到达点 $z$?
设 $x$ 是图中任意一点,蚂蚁在到达 $z$ 点之前平均需要经过 $x$ 多少次?
假设在图中的某些顶点处设置有陷阱,即蚂蚁一旦走到这些点就会被捉住,那么蚂蚁能成功到达 $z$ 点的概率是多少?
有趣的事情是,这些问题都可以用电网络的方法来解。粗略地说,如果你会求解一个电网络,你就会求解对应的随机游动。
电网络中的流
定义:一个电网络 $G=(V,E)$ 是一个连通无向的有限图,每条边 $e\in E$ 有一个权值 $c(e)\in(0,+\infty)$,权函数 $c(e)$ 即为 $e$ 的电导,$r(e)=1/c(e)$ 为 $e$ 的电阻。 如果 $e=\{x,y\}$,我们也记 $c(x,y)=c(e)$。
定义:网络 $G$ 上的随机游动,是一个可逆的 Markov 链,其从顶点 $x$ 到 $x$ 的邻居 $y$ 的转移概率为 $P(x,y)=c(x,y)/c(x)$,其中 $c(x)=\sum_{y\sim x}c(x,y)$。
注意这是一个可逆的 Markov 链,$\{c(x),x\in V\}$ 是其平稳测度。
定义:给定 $a,z\in V$,称定义在 $E$ 上的函数 $\theta$ 是一个从 $a$ 到 $z$ 的流,如果它满足下面的条件:
$\|\theta\|=\sum_{x\sim a}\theta(a,x)>0$。
对任何 $e=\{x,y\}$ 有 $\theta(x,y)=-\theta(y,x)$。
(基尔霍夫定律)对任何 $x\notin\{a,z\}$ 有 $\sum_{y\sim x}\theta(x,y)=0$。
$a$ 叫做流的源点,$z$ 叫做流的汇点。如果 $\|\theta\|=1$ 就称 $\theta$ 是一个单位流。
注:由定义不难证明 $\theta(a)=-\theta(z)$:
\[\theta(a)+\theta(z)=\sum_{x}\theta(x)=\sum_x\sum_y\theta(x,y)=\frac{1}{2}\sum_x\sum_y\left(\theta(x,y)+\theta(y,x)\right)=0.\]
定义:流 $\theta$ 的能量函数定义为 $\mathcal{E}(\theta)=\sum_{e\in E}\theta^2(e)r(e)$。
在若干定义之后,我们来叙述一个重要的定理:
Thomson 定理:在所有从 $a$ 到 $z$ 的单位流中,电流的能量最小。不仅如此,单位电流的能量等于网络的有效电阻 $\rm Reff$。
定理的证明并不难,不过完整写下来还是略占篇幅。我把它留给 Lyons 和 Peres 的书 Probability on Trees and Networks 2.4 节。
根据 Thompson 原理马上可以得到下面的
Rayleigh 单调原理:有效电阻 $\rm Reff$ 是关于 $\{r(e),e\in E\}$ 的递增函数。
概率的解释
仍然设 $G=(V,E)$ 是一个有限的网络,$a,z\in V$。假设在 $a,z$ 两点之间加上单位电压,这里我们约定 $v(a)=1$,$v(z)=0$。于是对任何 $x\notin\{a,z\}$,我们有 \[ 0=\sum_{y}i(x,y)=\sum_{y}\left(v(x)-v(y)\right)c(x,y),\]从而 \[v(x)c(x)=\sum_yc(x,y)v(y),\quad v(x)=\sum_yP(x,y)v(y).\]
你发现了什么?电势函数 $v$ 在 $x$ 处的值等于它在 $x$ 相邻顶点处的平均值。我们把这样的函数叫做调和函数:
定义:设 $\Omega$ 是 $V$ 的子集,$f$ 称作 $\Omega$ 上的调和函数,如果对任何 $x\in\Omega$ 有\[f(x)=\sum_{y\sim x}P(x,y)f(y).\]
这里关于调和的定义是分析中调和函数的离散版本,但是它们都有共同的性质:
给定 $f$ 在 $V\backslash\Omega$ 上每个点的值(称为边界值),则可唯一确定 $f$ 在 $\Omega$ 上的值。
证明与连续情形一样,都是利用极大值原理,并不复杂,这里就不再写了。
对任意 $x\in V$,考虑从 $x$ 出发的随机游动在访问 $z$ 之前到达 $a$ 的概率 $\mathbb{P}_x[\tau_a<\tau_z]$。利用单步转移概率分析不难证明 $x\to\mathbb{P}_x[\tau_a<\tau_z]$ 是 $V\backslash\{a,z\}$ 上的调和函数,且与 $v(x)$ 在 $\{a,z\}$ 处的边界值相同,因而它们是同一个函数,这样我们就得到了电势的概率解释:
电势的概率解释: 令 $v(a)=1$,$v(z)=0$,则 $v(x)=\mathbb{P}_x[\tau_a<\tau_z]$。
接下来我们引入一个重要的量:
\[\mathbb{P}[a\to Z]:=\mathbb{P}_a[\tau_z<\tau_a^+].\]
即从 $a$ 出发的随机游动在返回 $a$ 之前访问 $z$ 的概率。$\mathbb{P}[a\to z]$ 叫做逃离概率。这个概率很容易用电网络的物理量来表示:利用单步转移分析,有
\[\begin{align*}\mathbb{P}[a\to Z]&=\sum_{x\sim a}P(a,x)\mathbb{P}[\tau_z<\tau_a]\\&=\sum_{x\sim a}\frac{c(a,x)}{c(a)}\left(1-\frac{v(x)}{v(a)}\right)\\&=\frac{1}{c(a)v(a)}\|i\|.\end{align*}\]这个式子可以写成更直观的形式:
\[ \frac{v(a)}{\|i\|}=\frac{1}{c(a)\mathbb{P}[a\to z]}.\]
即如果把整个网络等效为单个电阻,则其电导为 ${\rm Ceff}=c(a)\mathbb{P}[a\to z]$,等于 $a$ 点的电导 $c(a)$ 乘以从 $a$ 逃离至 $z$ 的概率 $\mathbb{P}[a\to z]$。于是我们又得到了网络有效电导的概率解释:
有效电导的概率解释:${\rm Ceff}=c(a)\mathbb{P}[a\to z]$。
要给出电流的概率解释,还需要一个额外的定义:Green 函数
\[ G_{z}(a,x)=\mathbb{E}_a\left[\sum_{0\leq t<\tau_z} 1_{\{X_t=x\}}\right].\]
即从 $a$ 出发的随机游动在被 $z$ 吸收之前访问 $x$ 的期望次数。
当然,Green 函数也可以用物理量来表示,不过略微需要一点分析:由定义有 $G_z(a,z)=0$;要计算 $G_z(a,a)$,只要注意到在被 $z$ 吸收前访问 $a$ 的次数是一个以 $\mathbb{P}[a\to z]$ 为成功概率的几何分布的随机变量,因此
\[ G_z(a,a)=\frac{1}{\mathbb{P}[a\to z]}.\]
还需要求出 $G_z(a,x)$ 在 $x\notin\{a,z\}$ 时的值。我们来证明 $\frac{G_z(a,x)}{c(x)}$ 是 $V\backslash\{a,z\}$ 上的调和函数:首先我们有
\[ G_z(a,x)=\sum_{y\sim x}P(y,x)G_z(a,y),\]
这是利用了期望的线性性质,以及每次访问 $x$ 必然是从 $x$ 的某个邻居 $y$ 过去的。两边同时除以 $c(x)$,注意到 $G$ 上的随机游动是可逆的 Markov 过程,即 $c(x)P(x,y)=c(y)P(y,x)$,从而
\[ \frac{G_z(a,x)}{c(x)}=\sum_{y\sim x}P(x,y)\frac{G_z(a,y)}{c(y)},\]
这就证明了 $\frac{G_z(a,x)}{c(x)}$ 是 $V\backslash\{a,z\}$ 上的调和函数,利用调和函数解的唯一性,我们有
对任何 $x\in V$,$\frac{G(a,x)}{c(x)}$ 等于在 $a$ 点加上 $\frac{G_z(a,a)}{c(a)}={\rm Reff}$ 的电压(即 $\|i\|=1$),$v(z)=0$ 时 $x$ 处的电势。
设 $e=\{x,y\}$,记 $N_{x\to y}^z$ 是从 $a$ 出发的随机游动在到达吸收态 $z$ 之前从 $x$ 走到 $y$ 的次数,我们有如下的结论:
电流的概率解释: 假设 $\|i\|=1$,则 $i(x,y)=\mathbb{E}_a\left[N_{x\to y}^Z-N_{y\to z}^Z\right]$。
证明:
\[ \begin{align*}\mathbb{E}_a[N_{x\to y}^z]&=\mathbb{E}_a\left[\sum_{0\leq t<\tau_z}1_{\{X_t=x,X_{t+1}=y\}}\right]\\&=\sum_{t\geq0}\mathbb{P}[X_t=x,X_{t+1}=y,t<\tau_z]\\&=\sum_{t\geq0}\mathbb{P}[X_t=x,t<\tau_z]\cdot P(x,y)\\&=P(x,y)G_z(a,x).\end{align*}\]
这里第二行到第三行是用了强 Markov 性质。代入前面关于 Green 函数的表达式即可。
Lyons 判定
这一节我们考虑有可列多个顶点且每个顶点度数有限的连通图。
固定一个起始点 $a$,设 $G_n$ 是所有与 $a$ 的距离不超过 $n$ 的顶点以及它们之间的边构成的子图,其中 $G_0=\{a\}$,这里两个顶点 $x,y$ 之间的距离应理解为连接它们的最短路径的长度。设 $W_n=G\backslash G_n$,考虑逃离概率 $\mathbb{P}[a\to W_n]$。正如我们前面在罪犯的随机游动中看到的,$\{\mathbb{P}[a\to W_n]\}$ 是一个单调下降的序列,其极限(记作 $\mathbb{P}[a\to\infty]$)就是从 $a$ 出发的随机游动永不返回 $a$ 的概率,这个随机游动是暂态的当且仅当这个极限概率大于 0。
对有限图 $G_n$,考虑在 $a$ 点加上电压,$W_n$ 中的点全接地得到的网络,记这个网络的有效电阻为 ${\rm Reff}(n)$,我们已经知道
\[ {\rm Reff}(n) = \frac{1}{c(a)\mathbb{P}[a\to W_n]}.\]
由 Thompson 定理序列 $\{{\rm Reff}(n)\}$ 单调上升有极限(可能为 $+\infty$),记这个极限为 ${\rm Reff}(\infty)$,则
\[ {\rm Reff}(\infty)=\frac{1}{c(a)\mathbb{P}[a\to\infty]}.\]所以我们得到
定理:$G$ 上的随机游动是暂态的当且仅当 ${\rm Reff}(\infty)<+\infty$。
注意到有效电阻是单位电流的能量,我们可以给出另一种常返/暂态的判定:(如果你不会计算有效电阻,那么这个方法也许用得上)
定理【Lyons】:$G$ 上的随机游动是暂态的当且仅当存在一个从 $a$ 流向无穷远的能量有限的单位流。
证明:设 $\|\theta\|<\infty$ 是这样的一个单位流,那么把 $\theta$ 限制在 $G_n$ 上是一个从 $a$ 到 $W_n$ 的单位流 $\theta_n$。显然 ${\rm Reff}(n)\leq\|\theta_n\|\leq\|\theta\|$,从而取极限也有 ${\rm Reff(\infty)}\leq\|\theta\|<\infty$,即随机游动是暂态的。
反之若随机游动是暂态的,则 ${\rm Reff}(\infty)<+\infty$,于是我们知道对每个 $n$ 存在一个从 $a$ 到 $W_n$ 的单位流 $\theta_n$,其能量不超过 ${\rm Reff}(\infty)$。特别地从 $a$ 到 $W_n$ 的单位电流 $i_n$ 的能量也不超过 ${\rm Reff}(\infty)$。这里的关键在于去证明对每条边 $e=\{x,y\}$,序列 $\{i_n(x,y)\}$ 有极限 $i_\infty(x,y)$ 且 $i_\infty$ 是一个能量有限的单位流。为此考虑从 $a$ 出发的随机游动,记 $Y_n(x)$ 为此随机游动在到达 $W_n$ 前访问 $x$ 的次数,则由单调收敛有 $\mathbb{E}_a Y_n(x)\uparrow\mathbb{E}_aY_\infty(x)$,其中 $Y_\infty(x)$ 是访问 $x$ 的总次数。
我们前面(见 Green 函数的部分)证明了 $\mathbb{E}_aY_n(x)=c(x)v_n(x)$,所以我们可以定义 \[v_\infty(x)=\lim_{n\to\infty}v_n(x),\]于是
\[i_\infty(x,y)=c(x,y)(v_\infty(x)-v_\infty(y))=\lim_n c(x,y)(v_n(x)-v_n(y))=\lim_n i_n(x,y)\]
也是存在的;由于每个 $i_n$ 都是流,所以取极限可见 $i_\infty$ 也是流,且是单位流。注意到
\[\sum_{e\in G_n}c(e)i_\infty(e)^2=\lim_l \sum_{e\in G_n}c(e)i_l(e)^2\leq\varlimsup_l\mathcal{E}(i_l)\leq {\rm Reff(\infty)},\]
对 $n$ 取极限就得到 $i_\infty$ 的能量是有限的,这就证明了 Lyons 判定。
Polya 定理
定理 :$\mathbb{Z}^3$ 上的简单随机游动是暂态的。
由于是简单随机游动,因此格点 $\mathbb{Z}^3$ 的每条边的电导 $c(e)$ 都是 1。根据 Lyons 定理,我们只要以 $\mathbb{Z}^3$ 中任意一点为源,构造一个流向无穷远的能量有限的单位流即可。那么这个流应该怎样构造呢?我们先来看另一个以 Polya 命名的模型,从中得到启发。
Pólya 罐模型:设一个罐子里面有红黑白三种颜色的球各一个,每次从罐子中随机选一个球,然后将这个球,以及一个与这个球颜色相同的新球放回罐中。记 $n$ 次操作以后罐子中红黑白球的个数(这时候罐子里面有 $n+3$ 个球)为 $V_n=(R_n,B_n,W_n)$,则 $V_n$ 服从集合\[\mathcal{M}_n=\{(x,y,z)\in\mathbb{Z}^3:x\geq1,y\geq1,z\geq1,x+y+z=n+3\}\]上的均匀分布。(从而 $\mathcal{M}_n$ 中每个点出现的概率都是 $\dfrac{2}{(n+2)(n+1)}$)
类似的结论对任意多种颜色的球都是成立的,也很容易用归纳法证明,这里就不再写了。
利用 Polya 罐模型可以构造出我们想要的单位流来:考虑顶点集合
\[ \{(x,y,z)\in\mathbb{Z}^3:x\geq1,y\geq1,z\geq1.\}=\bigcup_{n\geq0}\mathcal{M}_n.\]
所有的边按照坐标递增的方向定向。对任一 $e=\{x,y\}$,定义流 $i$ 在 $e$ 上的值 $i(e)$ 为 Polya 罐模型中罐中球的状态从 $x$ 增长为 $y$ 的概率,则 $i$ 是一个从点 $(1,1,1)$ 出发流向无穷的单位流。
对任意的 $x\in\mathcal{M}_n$,我们有
\[\sum_{x\to y}i(x,y)^2\leq(\sum_{x\to y}i(x,y))^2=\left[\frac{2}{(n+2)(n+1)}\right]^2.\]
而 $|\mathcal{M}_n|=\frac{(n+2)(n+1)}{2}$,因此从 $\mathcal{M}_n$ 发出的边的能量之和不超过 $\frac{2}{(n+2)(n+1)}$,从而总能量\[\|i\|\leq\sum_{n=0}^\infty\frac{2}{(n+2)(n+1)}<\infty,\]
这就证明了三维随机游动是暂态的。