首先写出二阶矩方法的定理:
证明:
P ( X = 0 ) ≤ P ( ∣ X − E [ X ] ∣ ≥ E [ X ] ) ≤ V a r [ X ] ( E [ X ] ) 2 P(X = 0) \leq P(|X-E[X]| \geq E[X]) \leq \frac{Var[X]}{{(E[X])}^2} P(X=0)≤P(∣X−E[X]∣≥E[X])≤(E[X])2Var[X]
二阶矩方法可以应用在,对随机图中的阈值进行概率求解。
首先了解一下什么是随机图中的阈值:
在这里要补充一下(因为我是第一次实际用到这个知识):
下文中说 o ( 1 ) → 0 o(1) \rightarrow 0 o(1)→0就是这个原因,因为这并非表示 o ( 1 ) o(1) o(1),而是一定比 o ( 1 ) o(1) o(1)更小。
接下来我们给出关于随机图的一条定理:
在图 G n , p G_{n, p} Gn,p中,若在 p = f ( n ) = o ( n − 2 3 ) p = f(n) = o(n^{-\frac{2}{3}}) p=f(n)=o(n−32)且 n n n足够大的条件下。对于任意的 ε > 0 \varepsilon > 0 ε>0,使得:
P ( ∣ 顶点数大于4的团 ∣ ≥ 1 ) < ε P(|\text{顶点数大于4的团}| \geq 1) < \varepsilon P(∣顶点数大于4的团∣≥1)<ε
若 p = f ( n ) = ω ( n − 2 3 ) p = f(n) = \omega(n^{-\frac{2}{3}}) p=f(n)=ω(n−32),其余条件不变的情况下,有:
P ( ∣ 顶点数大于4的团 ∣ ≥ 1 ) > 1 − ε P(|\text{顶点数大于4的团}| \geq 1) > 1 - \varepsilon P(∣顶点数大于4的团∣≥1)>1−ε
也可以写作:
P ( ∣ 顶点数大于4的团 ∣ = 0 ) < ε P(|\text{顶点数大于4的团}| = 0) < \varepsilon P(∣顶点数大于4的团∣=0)<ε
证明1:定理中 p = f ( n ) = o ( n − 2 3 ) p = f(n) = o(n^{-\frac{2}{3}}) p=f(n)=o(n−32)的情况:
图中取出4个顶点一共有 C n 4 C_n^4 Cn4中情况。假设我们通过 X i X_i Xi表示第 i i i种情况下,四个顶点组成的是否是团,可以表示为:
X i = { 1 if C i is a 4-clique 0 otherwise X_i = \begin{cases} 1 & \text{if $C_i$ is a 4-clique} \\ 0 & \text{otherwise} \end{cases} Xi={10if Ci is a 4-cliqueotherwise
根据第一点我们可以知道 X = ∑ i = 1 C n 4 X i X = \sum_{i=1}^{C_n^4} X_i X=∑i=1Cn4Xi,同时因为一个四顶点的团有6条边,可得:
E [ X ] = C n 4 p 6 = O ( n 4 ) ⋅ o ( n − 4 ) = o ( 1 ) → 0 < ε E[X] = C_n^4 p^6 = O(n^4) \cdot o(n^{-4}) = o(1) \rightarrow 0 < \varepsilon E[X]=Cn4p6=O(n4)⋅o(n−4)=o(1)→0<ε
又因为Markov Inequality有 P ( X ≥ 1 ) ≤ E [ X ] P(X \geq 1) \leq E[X] P(X≥1)≤E[X],可得:
P ( X ≥ 1 ) ≤ E [ X ] < ε P(X \geq 1) \leq E[X] < \varepsilon P(X≥1)≤E[X]<ε
证明2:定理中 p = f ( n ) = ω ( n − 2 3 ) p = f(n) = \omega(n^{-\frac{2}{3}}) p=f(n)=ω(n−32)的情况:
对于定理中 p = f ( n ) = ω ( n − 2 3 ) p = f(n) = \omega(n^{-\frac{2}{3}}) p=f(n)=ω(n−32)的情况,为了证明 P ( X = 0 ) < ε P(X = 0) < \varepsilon P(X=0)<ε,我们需要用到二阶矩定理,可以将问题转化为证明 P ( X = 0 ) ≤ V a r [ X ] ( E [ X ] ) 2 < ε P(X = 0) \leq \frac{Var[X]}{{(E[X])}^2} < \varepsilon P(X=0)≤(E[X])2Var[X]<ε。但是期望好求,方差不好求,所以我们要先引入一条定理:
定理:若 Y i , i ∈ [ 1 , m ] Y_i, i \in [1, m] Yi,i∈[1,m]表示0-1随机变量,且 Y = ∑ i = 1 m Y i Y = \sum_{i=1}^{m} Y_i Y=∑i=1mYi,可得
V a r [ Y ] ≤ E [ Y ] + ∑ 1 ≤ i , j ≤ m ; i ≠ j C o v ( Y i , Y j ) Var[Y] \leq E[Y] + \sum_{1 \leq i, j \leq m; i \neq j} Cov(Y_i, Y_j) Var[Y]≤E[Y]+1≤i,j≤m;i=j∑Cov(Yi,Yj)
证明:
对于随机变量序列可以做如下转换:
V a r [ Y ] = V a r [ ∑ i = 1 m Y i ] = ∑ i = 1 m V a r [ Y i ] + ∑ 1 ≤ i , j ≤ m ; i ≠ j C o v ( Y i , Y j ) Var[Y] = Var[\sum_{i=1}^{m} Y_i] = \sum_{i=1}^m Var[Y_i] + \sum_{1 \leq i, j \leq m; i \neq j} Cov(Y_i, Y_j) Var[Y]=Var[i=1∑mYi]=i=1∑mVar[Yi]+1≤i,j≤m;i=j∑Cov(Yi,Yj)因为方差的性质可得:
V a r [ Y i ] = E [ Y i 2 ] − E [ Y i ] 2 ≤ E [ Y i ] Var[Y_i] = E[Y_i^2] - {E[Y_i]}^2 \leq E[Y_i] Var[Yi]=E[Yi2]−E[Yi]2≤E[Yi]代入第一个公式就可得:
V a r [ Y ] ≤ ∑ i = 1 m E [ Y i ] + ∑ 1 ≤ i , j ≤ m ; i ≠ j C o v ( Y i , Y j ) = E [ Y ] + ∑ 1 ≤ i , j ≤ m ; i ≠ j C o v ( Y i , Y j ) \begin{align} Var[Y] &\leq \sum_{i=1}^m E[Y_i] + \sum_{1 \leq i, j \leq m; i \neq j} Cov(Y_i, Y_j) \\ &= E[Y] + \sum_{1 \leq i, j \leq m; i \neq j} Cov(Y_i, Y_j) \end{align} Var[Y]≤i=1∑mE[Yi]+1≤i,j≤m;i=j∑Cov(Yi,Yj)=E[Y]+1≤i,j≤m;i=j∑Cov(Yi,Yj)
根据方差的不等式定理,我们知道除了期望还要考虑协方差。我们已知协方差的计算公式为:
C o v ( X , Y ) = E [ X Y ] − E [ X ] E [ Y ] Cov(X, Y) = E[XY] - E[X]E[Y] Cov(X,Y)=E[XY]−E[X]E[Y]
假如我们选取的点集(四个点)的情况表示为 { C 1 , C 2 , … , C C n 4 } {\lbrace C_1, C_2, \dots, C_{C_n^4} \rbrace} {C1,C2,…,CCn4},我们可以将协方差分为四类:
因为 E [ X Y ] − E [ X ] E [ Y ] < E [ X Y ] E[XY] - E[X]E[Y] < E[XY] E[XY]−E[X]E[Y]<E[XY]恒成立,我们直接用 E [ X Y ] E[XY] E[XY],可以得到:
V a r [ Y ] ≤ E [ Y ] + ∑ 1 ≤ i , j ≤ m ; i ≠ j C o v ( Y i , Y j ) ≤ C n 4 ⋅ p 6 + C n 6 ⋅ p 11 + C n 5 ⋅ p 9 = O ( n 4 q 6 + n 6 q 11 + n 5 q 9 ) \begin{align} Var[Y] &\leq E[Y] + \sum_{1 \leq i, j \leq m; i \neq j} Cov(Y_i, Y_j) \\ &\leq C_n^4 \cdot p^6 + C_n^6 \cdot p^{11} + C_n^5 \cdot p^9 \\ &= O(n^4 q^6 + n^6 q^{11} + n^5 q^9) \end{align} Var[Y]≤E[Y]+1≤i,j≤m;i=j∑Cov(Yi,Yj)≤Cn4⋅p6+Cn6⋅p11+Cn5⋅p9=O(n4q6+n6q11+n5q9)
代入公式 P ( X = 0 ) ≤ V a r [ X ] ( E [ X ] ) 2 P(X = 0) \leq \frac{Var[X]}{{(E[X])}^2} P(X=0)≤(E[X])2Var[X]可得:
P ( X = 0 ) ≤ V a r [ X ] ( E [ X ] ) 2 = O ( n 4 q 6 + n 6 q 11 + n 5 q 9 ) o ( n 4 q 6 ) 2 = O ( n − 4 q − 6 + n − 2 q − 1 + n − 3 q − 3 ) \begin{align} P(X = 0) &\leq \frac{Var[X]}{{(E[X])}^2} \\ &= \frac{O(n^4 q^6 + n^6 q^{11} + n^5 q^9)}{{o(n^4 q^6)}^2} \\ &= O(n^{-4} q^{-6} + n^{-2} q^{-1} + n^{-3} q^{-3}) \end{align} P(X=0)≤(E[X])2Var[X]=o(n4q6)2O(n4q6+n6q11+n5q9)=O(n−4q−6+n−2q−1+n−3q−3)
当 p = f ( n ) = ω ( n − 2 3 ) p = f(n) = \omega(n^{-\frac{2}{3}}) p=f(n)=ω(n−32)时可得:
P ( X = 0 ) = o ( 1 + n − 4 / 3 + n − 1 ) = o ( 1 ) P(X = 0) = o(1 + n^{-4/3} + n^{-1}) = o(1) P(X=0)=o(1+n−4/3+n−1)=o(1)
在介绍定理之前,我们先介绍一下事件独立性的概念:
假定有一组事件 A 1 , A 2 , … , A n A_1, A_2, \dots, A_n A1,A2,…,An,他们发生的概率 P ( A i ) ≤ p < 1 P(A_i) \leq p < 1 P(Ai)≤p<1,如果他们互相独立,则有:
P ( ∩ i A i ˉ ) ≥ ( 1 − p ) n > 0 P(\cap_{i} {\bar {A_i}}) \geq {(1 - p)}^n > 0 P(∩iAiˉ)≥(1−p)n>0
与上条件相同,但事件之间相互不独立,则有:
P ( ∩ i A i ˉ ) ≥ 1 − ∑ P ( A i ) P(\cap_{i} {\bar {A_i}}) \geq 1 - \sum P(A_i) P(∩iAiˉ)≥1−∑P(Ai)
对于独立的事件具有以下的性质:
P ( A ) = P ( A ∣ ∩ i ∈ [ 1 , N ] A i ) P(A) = P(A| \cap_{i \in [1, N]} A_i) P(A)=P(A∣∩i∈[1,N]Ai)
我们给LLL定理一个定义:
这里证明一下 p d ≤ 1 4 pd \leq \frac{1}{4} pd≤41的情况。
为了证明LLL,这里引入一条引理,就非常好证明LLL了:
通过这条引理我吗就可以证明LLL定理了:
我们将LLL定理中的 P ( ∩ i A i ˉ ) P(\cap_{i} {\bar {A_i}}) P(∩iAiˉ)展开得:
P ( ∩ i A i ˉ ) = ( 1 − P ( A 1 ) ) ( 1 − P ( A 2 ∣ A 1 ˉ ) ) … ( 1 − P ( A i ∣ ∩ j < i A j ˉ ) ) P(\cap_{i} {\bar {A_i}}) = {(1-P(A_1))} {(1-P(A_2|{\bar {A_1}}))} \dots {(1-P(A_i|\cap_{j < i}{\bar {A_j}}))} P(∩iAiˉ)=(1−P(A1))(1−P(A2∣A1ˉ))…(1−P(Ai∣∩j<iAjˉ))
根据上文的Lemma可以知道:
{ P ( A 1 ) ≤ 2 p P ( A 2 ∣ A 1 ˉ ) ≤ 2 p … P ( A i ∣ ∩ j < i A j ˉ ) ≤ 2 p \begin{cases} P(A_1) \leq 2p \\ P(A_2|{\bar {A_1}}) \leq 2p \\ \dots \\ P(A_i|\cap_{j < i}{\bar {A_j}}) \leq 2p \\ \end{cases} ⎩ ⎨ ⎧P(A1)≤2pP(A2∣A1ˉ)≤2p…P(Ai∣∩j<iAjˉ)≤2p
所以可以将公式转换为:
P ( ∩ i A i ˉ ) ≥ ( 1 − 2 p ) i = ( 1 − 2 p ) n P(\cap_{i} {\bar {A_i}}) \geq {(1-2p)}^i = {(1-2p)}^n P(∩iAiˉ)≥(1−2p)i=(1−2p)n
所以我们接下来主要证明上述Lemma
我们分成两种情况来讨论:
∣ S ∣ = 0 |S| = 0 ∣S∣=0:没有集合的情况下说明没有其他的事件,所以可得
P ( A ∣ ∅ ) = P ( A ) ≤ p ≤ 2 p P(A| \empty) = P(A) \leq p \leq 2p P(A∣∅)=P(A)≤p≤2p
得证 ∣ S ∣ = 0 |S| = 0 ∣S∣=0时刻
∣ S ∣ = k + 1 |S| = k+1 ∣S∣=k+1:我们假设引理适用于 ∣ S ∣ ≤ k |S| \leq k ∣S∣≤k的所有情况,通过数学归纳法证明 ∣ S ∣ = k + 1 |S| = k+1 ∣S∣=k+1时刻的情况。
第一种情况我们简单就证明了,核心就在第二种情况上,我们先来给第二种情况做一些定义:
根据以上定义,再次分成两种情况:
当 ∣ S i n d ∣ = k + 1 |S^{ind}| = k+1 ∣Sind∣=k+1时,或者说是 S i n d = S S^{ind} = S Sind=S时,我们可得:
P ( A ∣ ∩ j ∈ S A j ˉ ) = P ( A ) ≤ p ≤ 2 p P(A| \cap_{j \in S} {\bar {A_j}}) = P(A) \leq p \leq 2p P(A∣∩j∈SAjˉ)=P(A)≤p≤2p
得证 ∣ S ∣ = k + 1 |S| = k+1 ∣S∣=k+1且 ∣ S i n d ∣ = k + 1 |S^{ind}| = k+1 ∣Sind∣=k+1的情况
当 ∣ S i n d ∣ < k + 1 |S^{ind}| < k+1 ∣Sind∣<k+1时,我们可以通过Bayes Formula将 S S S通过条件概率的方式拆分开:
P ( A ∣ ∩ j ∈ S A j ˉ ) = P ( A ∣ ∩ j ∈ S d e p A j ˉ , ∩ j ∈ S i n d A j ˉ ) = P ( A , ∩ j ∈ S d e p A j ˉ ∣ ∩ j ∈ S i n d A j ˉ ) P ( ∩ j ∈ S d e p A j ˉ ∣ ∩ j ∈ S i n d A j ˉ ) \begin{align} P(A| \cap_{j \in S} {\bar {A_j}}) &= P(A| \cap_{j \in S^{dep}} {\bar {A_j}}, \cap_{j \in S^{ind}} {\bar {A_j}}) \\ &= \frac{P(A, \cap_{j \in S^{dep}} {\bar {A_j}}| \cap_{j \in S^{ind}} {\bar {A_j}})}{P(\cap_{j \in S^{dep}} {\bar {A_j}}| \cap_{j \in S^{ind}} {\bar {A_j}})} \end{align} P(A∣∩j∈SAjˉ)=P(A∣∩j∈SdepAjˉ,∩j∈SindAjˉ)=P(∩j∈SdepAjˉ∣∩j∈SindAjˉ)P(A,∩j∈SdepAjˉ∣∩j∈SindAjˉ)
通过对条件的Bayes变换,我们可以分别将分子与分母求解出来:
分子:
P ( ∩ j ∈ S d e p A j ˉ ∣ ∩ j ∈ S i n d A j ˉ ) ≥ 1 − ∑ j ∈ S d e p P ( A j ∣ ∩ j ∈ S i n d A j ˉ ) ⏞ = P ( A j ) —独立 ⏟ P ( ∩ i A i ˉ ) ≥ 1 − ∑ P ( A i ) ≥ 1 − ∣ S d e p ∣ ⏟ p d ≤ 1 4 ⟹ ∣ S d e p ∣ = d ≤ 1 4 p ( 2 p ) ≥ 1 − 1 4 p ⋅ 2 p = 1 2 \begin{align} P(\cap_{j \in S^{dep}} {\bar {A_j}}| \cap_{j \in S^{ind}} {\bar {A_j}}) &\geq \underbrace{ 1 - \sum_{j\in S^{dep}} \overbrace{P(A_j| \cap_{j \in S^{ind}} {\bar {A_j}})}^{ =P(A_j) \text{—独立} } }_{P(\cap_{i} {\bar {A_i}}) \geq 1 - \sum P(A_i)} \\ &\geq 1 - \underbrace{|S^{dep}|}_{pd \leq \frac{1}{4} \implies |S^{dep}| = d \leq \frac{1}{4p}}(2p) \\ &\geq 1- \frac{1}{4p} \cdot 2p \\ &= \frac{1}{2} \\ \end{align} P(∩j∈SdepAjˉ∣∩j∈SindAjˉ)≥P(∩iAiˉ)≥1−∑P(Ai) 1−j∈Sdep∑P(Aj∣∩j∈SindAjˉ) =P(Aj)—独立≥1−pd≤41⟹∣Sdep∣=d≤4p1 ∣Sdep∣(2p)≥1−4p1⋅2p=21
分母:
P ( A , ∩ j ∈ S d e p A j ˉ ∣ ∩ j ∈ S i n d A j ˉ ) ≤ P ( A ∣ ∩ j ∈ S i n d A j ˉ ) ⏟ = P ( A ) —独立 ≤ p P(A, \cap_{j \in S^{dep}} {\bar {A_j}}| \cap_{j \in S^{ind}} {\bar {A_j}}) \leq \underbrace{P(A| \cap_{j \in S^{ind}} {\bar {A_j}})}_{=P(A) \text{—独立}} \leq p P(A,∩j∈SdepAjˉ∣∩j∈SindAjˉ)≤=P(A)—独立 P(A∣∩j∈SindAjˉ)≤p
由此可证在 ∣ S ∣ = k + 1 |S| = k+1 ∣S∣=k+1且 ∣ S i n d ∣ < k + 1 |S^{ind}| < k+1 ∣Sind∣<k+1的情况下:
P ( A ∣ ∩ j ∈ S A j ˉ ) = P ( A , ∩ j ∈ S d e p A j ˉ ∣ ∩ j ∈ S i n d A j ˉ ) P ( ∩ j ∈ S d e p A j ˉ ∣ ∩ j ∈ S i n d A j ˉ ) ≤ 2 p P(A| \cap_{j \in S} {\bar {A_j}}) = \frac{P(A, \cap_{j \in S^{dep}} {\bar {A_j}}| \cap_{j \in S^{ind}} {\bar {A_j}})}{P(\cap_{j \in S^{dep}} {\bar {A_j}}| \cap_{j \in S^{ind}} {\bar {A_j}})} \leq 2p P(A∣∩j∈SAjˉ)=P(∩j∈SdepAjˉ∣∩j∈SindAjˉ)P(A,∩j∈SdepAjˉ∣∩j∈SindAjˉ)≤2p
在上一节的LLL中,我们只用到了两个参数: p p p表示概率、 d d d表示临域的大小。上一节我们通过定义 p , d p,d p,d之间的关系求解了概率边界,我们自然会想要通过更普遍的方式求得概率边界。于是我们提出了Asymmetric LLL,下面我们做一个定义:
这条定理本文就不做证明,但是这条定理是包含LLL的,我们可以做一个分析:
假设 r i = 1 d + 1 r_i = \frac{1}{d+1} ri=d+11,我们可以通过在LLL中的定义得到:
P ( A i ) ( d + 1 ) ≤ 1 e ⟹ P ( A i ) ≤ 1 d + 1 ⋅ 1 e ≤ 1 d + 1 ⋅ ( 1 − 1 d + 1 ) d ≤ 1 d + 1 ⋅ ∏ j ∉ S i ( 1 − 1 d + 1 ) = r i ⋅ ∏ j ∉ S i ( 1 − r i ) \begin{align} & P(A_i)(d+1) \leq \frac{1}{e} \\ \implies& P(A_i) \leq \frac{1}{d+1} \cdot \frac{1}{e} \leq \frac{1}{d+1} \cdot {\left( 1 - \frac{1}{d+1} \right)}^d \\ &\leq \frac{1}{d+1} \cdot \prod_{j \notin S_i}{\left( 1 - \frac{1}{d+1} \right)} = r_i \cdot \prod_{j \notin S_i} {(1-r_i)} \end{align} ⟹P(Ai)(d+1)≤e1P(Ai)≤d+11⋅e1≤d+11⋅(1−d+11)d≤d+11⋅j∈/Si∏(1−d+11)=ri⋅j∈/Si∏(1−ri)
这样条件就等价变换了
然后代入Asymmetric LLL的结果中可以得到:
P ( ∩ i A i ˉ ) ≥ ∏ i ( 1 − r i ) = ( 1 − 1 d + 1 ) n > 0 P(\cap_{i} {\bar {A_i}}) \geq \prod_{i}(1-r_i) = {(1-\frac{1}{d+1})}^n > 0 P(∩iAiˉ)≥i∏(1−ri)=(1−d+11)n>0
结果也与LLL等价了
Asymmetric LLL相较于LLL更加具有普遍性,但从结果上来说也更麻烦了,因为要自己提出 r r r的定义