【支持向量机SVM】 函数间隔设为1原因 详解

\quad 这几天看SVM,优化问题那里习惯上函数间隔设为1,一直没看到比较令人信服的详解,这里我提一下。

线性可分支持向量机的约束优化原始问题:
max ⁡ w , b γ ^ ∣ ∣ w ∣ ∣ s . t . y i ( w ⋅ x i + b ) ≥ γ ^ , i = 1 , 2 , . . . , N \max \limits_{w,b} \quad \frac{ \hat \gamma}{||w||} \\ s.t. \quad\quad y_i( \bm{w} \cdot x_i + b) \geq \hat\gamma , \quad i=1,2,...,N w,bmaxwγ^s.t.yi(wxi+b)γ^,i=1,2,...,N
上式中 γ ^ \hat \gamma γ^即为函数间隔,且
γ ^ = m i n   y i ( w ⋅ x i + b ) \hat \gamma=min \ y_i(\bm{w} \cdot \bm{x_i} + b) γ^=min yi(wxi+b)
\quad 如果函数间隔可以任意设置,比如令 γ ^ ′ = 1 \hat \gamma '=1 γ^=1
,做法就是在原来的函数间隔表达式两边同除 γ \gamma γ,那么新的函数间隔必须满足
γ ^ ′ = m i n   y i ( w ′ ⋅ x i ′ + b ) = 1 \hat \gamma'=min \ y_i(\bm{w'} \cdot \bm{x_i'} + b)=1 γ^=min yi(wxi+b)=1
其中
w ′ = w γ ^ b ′ = b γ ^ \bm{w'}=\frac{\bm{w}}{\hat \gamma} \\ b'=\frac{b}{\hat \gamma} \\ w=γ^wb=γ^b
也就是说强行令函数间隔取1之后,原来描述的超平面是 ( w , b ) (\bm{w},b) (w,b),现在描述的超平面变成了 ( w γ ^ , b γ ^ ) (\frac{\bm{w}}{\hat \gamma},\frac{b}{\hat \gamma}) (γ^w,γ^b),但是w,b的同比例变化并不会改变所描述的超平面,函数间隔取其他值同理。
\quad 更进一步,我们看看SVM的约束优化原始问题是否会受函数间隔影响。取函数间隔 γ ^ ′ = 1 \hat \gamma' = 1 γ^=1后,超平面当前的描述为 ( w γ ^ , b γ ^ ) (\frac{\bm{w}}{\hat \gamma},\frac{b}{\hat \gamma}) (γ^w,γ^b),对应的原始问题:
\quad 首先看优化目标:
max ⁡ w ′ , b γ ^ ′ ∣ ∣ w ′ ∣ ∣ ⇒ 1 ∣ ∣ w γ ^ ∣ ∣ ⇒ γ ^ ∣ ∣ w ∣ ∣ \max \limits_{w',b} \quad \frac{ \hat \gamma'}{||w'||} \Rightarrow \frac{1}{||\frac{\bm{w}}{\hat \gamma}||} \Rightarrow \frac{ \hat \gamma}{||w||} w,bmaxwγ^γ^w1wγ^
可见,优化的目标函数不变。
\quad 变化后的约束不等式:
s . t . y i ( w γ ^ ⋅ x i + b γ ^ ) ≥ 1 , i = 1 , 2 , . . . , N ⇒ s . t . y i ( w ⋅ x i + b ) ≥ γ ^ , i = 1 , 2 , . . . , N s.t. \quad\quad y_i(\frac {\bm{w}}{\hat \gamma} \cdot x_i + \frac {b}{\hat \gamma}) \geq 1 , \quad i=1,2,...,N \\ \Rightarrow s.t. \quad\quad y_i( \bm{w} \cdot x_i + b) \geq \hat\gamma , \quad i=1,2,...,N s.t.yi(γ^wxi+γ^b)1,i=1,2,...,Ns.t.yi(wxi+b)γ^,i=1,2,...,N
约束不等式也不变。
综上,任意改变函数间隔不会影响SVM的优化原始问题

你可能感兴趣的:(支持向量机,svm,硬间隔)