机器学习基石 7.4 Interpreting VC Dimension

文章目录

  • VC Bound Rephrase: Penalty for Model Complexity
  • THE VC Message
  • VC Bound Rephrase: Sample Complexity
  • Looseness of VC Bound
  • Fun Time

VC Bound Rephrase: Penalty for Model Complexity

VC Bound:

机器学习基石 7.4 Interpreting VC Dimension_第1张图片

改述:好事情发生(GOOD)

机器学习基石 7.4 Interpreting VC Dimension_第2张图片

gen.error:generalization error
得到 E o u t E_{out} Eout的范围。

机器学习基石 7.4 Interpreting VC Dimension_第3张图片

根号这一项被叫做model complexity。

机器学习基石 7.4 Interpreting VC Dimension_第4张图片

THE VC Message

机器学习基石 7.4 Interpreting VC Dimension_第5张图片

横轴是VC dimension,纵轴是Error。
model complexity随着VC dimension的变大而变大。
VC dimension增大后,可以shatter的点变多(hypothesis变强), E i n E_{in} Ein减小。
VC dimension增大后,模型复杂度(model complexity)增大,导致要付出的代价变大。
所以 E o u t E_{out} Eout通常会先减后增。

强大的 H \mathcal{H} H E i n E_{in} Ein很小)并不总是好的。

机器学习基石 7.4 Interpreting VC Dimension_第6张图片

VC Bound Rephrase: Sample Complexity

VC Bound:

机器学习基石 7.4 Interpreting VC Dimension_第7张图片

一个例子:

机器学习基石 7.4 Interpreting VC Dimension_第8张图片

然而实践上一般 10 d V C 10d_{VC} 10dVC的资料就够用了。

机器学习基石 7.4 Interpreting VC Dimension_第9张图片

Looseness of VC Bound

上面的例子说明了VC Bound实际上是很宽松的。

机器学习基石 7.4 Interpreting VC Dimension_第10张图片

原因:

机器学习基石 7.4 Interpreting VC Dimension_第11张图片

对于不同的模型,VC Bound 的宽松程度实际上是差不多的。

这里写图片描述

Fun Time

机器学习基石 7.4 Interpreting VC Dimension_第12张图片

你可能感兴趣的:(机器学习,机器学习基石)