Hoeffding不等式及其在机器学习中的应用

参考   Hoeffding不等式及其在机器学习中的应用 - 云+社区 - 腾讯云

考虑二分类问题y\in \{ -1,+1\}和真实函数f, 假定基分类器的错误率为\epsilon, 即对每个基分类器h_i

                                                 P(h_i(x)\neq f(x))=\epsilon                                        (1)


假设集成通过简单投票法结合T个基分类器, 若有超过半数的基分类器正确, 则集成分类就正确:

                                                    H(x)=sian(\sum_{i=1}^Th_i(x))                                (2)
假设基分类器的错误率相互独立, 则由Hoeffding不等式可知, 集成的错误率为:

                            P(H(x)\neq f(x))=\sum_{k=0}^{|T/2|}\binom{T}{k}(1-\epsilon)^k\epsilon ^{T-k}\leq exp(-\frac{1}{2}T(1-2\epsilon)^2)                    (3)

Hoeffding不等式适用于有界的随机变量. 设有两两独立的一系列随机变量X1,...,Xn. 假设对所有的1≤i≤n, Xi都是几乎有界的变量, 即满足:

                                                P(X_i \in[a_i,b_i])=1                               (4)


那么这n个随机变量的经验期望:

                                                \overline{X}=\frac{X_1+\cdot \cdot \cdot + X_n}{n}                               (5)


满足以下的不等式:

                                             Hoeffding不等式及其在机器学习中的应用_第1张图片                       (6),(7)       

伯努利随机变量的特例

假定一个硬币A面朝上的概率为p, 则B面朝上的概率为1−p. 抛n次硬币, A面朝上次数的期望值为n∗p. 则A面朝上的次数不超过k次的概率为:

                                            Hoeffding不等式及其在机器学习中的应用_第2张图片                                    (8)


H(n)为抛n次硬币A面朝上的次数

对某一ε>0当k=(p−ε)n 时, 有Hoeffding不等式

                                                                          (9)


对应的, 当k=(p+ε)n 时,

                                                                         (10)


由此可得

                                                               (11)


利用式(9)可推式(3)

式(3)的1−ϵ相当于式(9)的p , 令H(n)为基分类器分类正确的数量, 有     

                                                                            (12)

总分类器的数量为T(就是n), 令\frac{T}{2}=(1-\epsilon -\epsilon )T, 可推得\epsilon =\frac{1}{2}-\epsilon , 根据式(9)可得
 

                                 Hoeffding不等式及其在机器学习中的应用_第3张图片                               (13)

便得到式(3)得最终不等式形式

你可能感兴趣的:(工程数学,计算机视觉,深度学习,机器学习)