机器学习中的函数间隔和几何间隔

目录

  • 一、函数间隔
  • 二、几何间隔
  • 三、函数间隔和几何间隔的关系

一、函数间隔

函数间隔
一般来说, 一个点距离分离超平面的远近可以表示分类预测的确信程度。在超平面 w ⋅ x + b = 0 w\cdot x+b=0 wx+b=0 确定的情况下, ∣ w ⋅ x + b ∣ |w\cdot x+b| wx+b能够相对地表示点距离超平面的远近。 w ⋅ x + b w\cdot x+b wx+b 的符号与类标记 y y y 的符号是否一致能够表示分类是否正确。所以可用 y ( w ⋅ x + b ) y(w\cdot x+b) y(wx+b)来表示分类的正确性及确信度,这就是函数间隔(functional margin)的概念。
定义
对于给定的训练数据集 T T T 和超平面 ( w , b ) (w,b) (w,b),定义超平面 ( w , b ) (w,b) (w,b) 关于样本点 ( x i , y i ) (x_i,y_i) (xi,yi)的函数间隔为:
γ i ^ = y i ( w ⋅ x i + b ) \hat{\gamma_i}=y_i(w\cdot x_i+b) γi^=yi(wxi+b)
定义超平面 ( w , b ) (w,b) (w,b) 关于训练数据集 T T T 的函数间隔为超平面 ( w , b ) (w,b) (w,b) 关于 T T T 中所有样本点 ( x i , y i ) (x_i,y_i) (xi,yi) 的函数间隔最小值,即:
γ ^ = m i n i = 1 , 2 , . . . , N γ i ^ \hat{\gamma}=\mathop{min}\limits_{i=1,2,...,N}\hat{\gamma_i} γ^=i=1,2,...,Nminγi^

当选择分离超平面时,只有函数间隔还不够。因为只要成比例地改变,例如将它们改为 ( 2 w , 2 b ) (2w,2b) (2w,2b),平面并没有改变,但函数间隔却成为原来的两倍。所以可以对分离超平面的法向量加某些约束,如规范化, ∣ ∣ w ∣ ∣ = 1 ||w||=1 w=1,使得间隔是确定的 。这时函数间隔成为几何间隔 (geometric margin)

二、几何间隔

定义
对于给定的训练数据集 T T T 和超平面 ( w , b ) (w,b) (w,b),定义超平面 ( w , b ) (w,b) (w,b) 关于样本点 ( x i , y i ) (x_i,y_i) (xi,yi)的几何间隔为:
γ i = y i ( w ∣ ∣ w ∣ ∣ ⋅ x i + b ∣ ∣ w ∣ ∣ ) \gamma_i=y_i({w\over||w||}\cdot x_i+{b\over||w||}) γi=yi(wwxi+wb)
定义超平面 ( w , b ) (w,b) (w,b) 关于训练数据集 T T T 的几何间隔为超平面 ( w , b ) (w,b) (w,b) 关于 T T T 中所有样本点 ( x i , y i ) (x_i,y_i) (xi,yi) 的几何间隔最小值,即:
γ = m i n i = 1 , 2 , . . . , N γ i ^ \gamma=\mathop{min}\limits_{i=1,2,...,N}\hat{\gamma_i} γ=i=1,2,...,Nminγi^
超平面 ( w , b ) (w,b) (w,b) 关于样本点 ( x i , y i ) (x_i,y_i) (xi,yi) 的几何间隔 般是实例点到超平面的带符号的距离 (signed distance) ,当样本点被超平面正确分类时就是实例点到超平面的距离。

三、函数间隔和几何间隔的关系

γ i = γ ^ i ∣ ∣ w ∣ ∣ \gamma_i={\hat\gamma_i\over||w||} γi=wγ^i

γ = γ ^ ∣ ∣ w ∣ ∣ \gamma={\hat\gamma\over||w||} γ=wγ^

∥ w ∥ = 1 \|w\|=1 w=1,那么函数间隔和几何间隔相等,如果超平面参数成比例地改变(超平面没有改变) ,函数间隔也按此比例改变,而几何间隔不变

你可能感兴趣的:(ML,支持向量机,机器学习,python,算法,神经网络)