对于Chernoff边界的理解

        在介绍Chernoff边界之前,首先回顾一下两个重要不等式,Markov不等式和Chebyshev不等式。

        定理1 Markov不等式: 令X为非负随机变量,那么对于任意的a>0,有

P(X\geq a)\leq\tfrac{E(X)}{a}

        定理2 Chebyshev不等式:令X为期望为E(X)方差为D(X)的随机变量,那么对于任意的a>0,有

P(\left | X-E(X) \right |\geq a)\leq \tfrac{D(x)}{a^{2}}

        关于以上两个不等式的证明和理解可以参考切比雪夫不等式到底是个什么概念? - 知乎。

        Markov不等式和Chebyshev不等式考虑随机变量取值在一定区间内的概率,而Chernoff边界考虑的是若干随机变量的和的取值概率。它的推导需要用到Markov不等式,我们首先来看一下Chernoff边界的定义。

        定理3 Chernoff边界:令X=\sum_{i=1}^{n}X_{i},其中X_{i}=1的概率为pi,X_{i}=0的概率为1-pi,所有的Xi都是独立的。令\mu =E(X)=\sum_{i=1}^{n}pi。那么

        (i)Upper Tail:P(X\geq (1+\delta )\mu)\leq e^{-\mu \tfrac{\delta ^{2}}{2+\delta }} for all \delta > 0

        (ii)Lower Tail:P(X\leq (1-\delta )\mu)\leq e^{-\mu \tfrac{\delta ^{2}}{2}} for all 0< \delta <1

        关于Chernoff边界的证明:

        首先回想一下Markov不等式,对于任意的s>0

        P(X\geq a) = P(e^{sX}\geq e^{sa})\leq \frac{E(e^{sX})}{e^{sa}}                                  (1)

        同样的,对于任意s>0,有

        P(X\leq a) = P(e^{-sX}\geq e^{-sa})\leq \frac{E(e^{-sX})}{e^{-sa}}                              (2)

        接下来,我们引入矩函数(momont generating function)M_{X}

M_{X}(s)=E(e^{sX})                                                  (3)

        矩函数有着如下性质:

        引理1:如果X= \sum_{i=1}^{n}X_{i},其中Xi是独立随机变量,那么M_{X}(s)=\prod_{i=1}^{n}M_{X_{i}}(s)

        定理的证明过程用到了期望的一个性质,即独立变量的乘积的期望等于两个变量期望的乘积,证明过程并不难,这里为了偷懒直接放图片了:

对于Chernoff边界的理解_第1张图片

         接下来,我们介绍矩函数的第二个性质:

        引理2:令Y为一个服从0-1分布的随机变量,以p的概率取值为1,以1-p的概率取值为0,那么,对于所有的s∈R来说,都有:

        M_{Y}(s)=E(e^{sY})\leq e^{p(e^{s}-1)}

         证明过程用到了一个关于e^{x}的不等式:1+x\leq e^{x}(该不等式可由泰勒展开式或者函数求导证明):

对于Chernoff边界的理解_第2张图片

        我们现在已经得到了关于矩函数的两个性质,那么,把引理1和引理2相结合,我们可以得到:

M_{X}(s)\leq \prod_{i=1}^{n}e^{p^{_{i}}(e^{s}-1)}=e^{(e^{s}-1)\sum_{i=1}^{n}p_{i}}\leq e^{(e^{s}-1)\mu                    (4)

        这里μ等于n个随机变量的期望的和也就是X的期望。

        接下来我们首先考虑Chernoff边界的上尾。

        令a=(1+\delta )\mu,应用Markov不等式,得到:

        P(X\geq (1+\delta )\mu )\leq e^{(e^{s}-1)\mu }e^{-s(1+\delta )\mu }                                 (5)

        然后令s=ln(1+\delta ),带入上式,可得

P(X\geq (1+\delta )\mu )\leq e^{(e^{s}-1)\mu }e^{-s(1+\delta )\mu }\leq e^{(e^{s}-1)\mu }                     (6)

        对rhs求以e为底的对数,可得

        \mu (\delta -(1+\delta )ln(1+\delta ))                                            (7)

        然后,可证当\delta > 0时,如下不等式成立(可用函数求导证明):

        ln(1+\delta )\geq \frac{\delta }{1+\delta /2}                                              (8)

        那么带入7式,可得:

        \mu (\delta -(1+\delta )ln(1+\delta ))\leq -\frac{\delta ^{2}}{2+\delta }\mu                            (9)

        带入6式可得:

P(X\geq (1+\delta )\mu)\leq e^{-\mu \tfrac{\delta ^{2}}{2+\delta }}

        上尾证毕。

        关于下尾,证明方法和上尾类似,取s=ln(\frac{1}{1-\delta }),带入(2)式,并利用ln(1-\delta )\geq -\delta +\frac{\delta ^{2}}{2}(可利用泰勒展开式证明)即可完成对下尾的证明。

        参考资料:

        [1]https://math.mit.edu/~goemans/18310S15/chernoff-notes.pdf

        [2]https://people.eecs.berkeley.edu/~jfc/cs174/lecs/lec10/lec10.pdf

        [3]X-Order Lab读书会第一期_Probability and Computing & Chernoff and Hoeffding Bounds_哔哩哔哩_bilibili

你可能感兴趣的:(概率论)