机器学习基石 - The VC Dimension

机器学习基石上 (Machine Learning Foundations)—Mathematical Foundations
Hsuan-Tien Lin, 林轩田,副教授 (Associate Professor),资讯工程学系 (Computer Science and Information Engineering)

The VC Dimension

Recap

机器学习基石 - The VC Dimension_第1张图片

Definition of VC Dimension

VC Dimension

the formal name of maximum non-break point

机器学习基石 - The VC Dimension_第2张图片

the Four VC Dimensions

机器学习基石 - The VC Dimension_第3张图片

VC Dimension and Learning

  • finite dVCg d V C ⟹ g can generalize Eout(g)Ein(g) E o u t ( g ) ≈ E i n ( g )
  • regardless of learning algorithm A A 、input distribution P P 、target function f f

VC Dimension of Perceptrons

2D PLA Revisited

机器学习基石 - The VC Dimension_第4张图片

d-D perceptrons: dVC=d+1 ? d V C = d + 1   ?

dVCd+1 d V C ≥ d + 1

机器学习基石 - The VC Dimension_第5张图片
- There are some d+1 d + 1 inputs we can shatter.
- 每一行代表一个点
- 灰色部分(第一列)视作第 0 维,是常数,代表 threshhold
- X X 可逆
- 任意的 Y Y 都可以表示出来

dVCd+1 d V C ≤ d + 1

机器学习基石 - The VC Dimension_第6张图片

  • We cannot shatter any set of d+2 d + 2 inputs.
  • linear dependence restricts dichotomy
  • 任意一个可以 shatter 的 d+1 d + 1 向量组再加一维
  • Xd+2 X d + 2 能被前 d+1 d + 1 个向量线性表出

Physical Intuition of VC Dimension

Degrees of Freedom 自由度

  • dVCfreeparameters d V C ≈ f r e e p a r a m e t e r s

Penalty for Model Complexity

机器学习基石 - The VC Dimension_第7张图片

  • with a high probability, EoutEin+Ω(N,H,δ) E o u t ≤ E i n + Ω ( N , H , δ )

  • The VC Message
    机器学习基石 - The VC Dimension_第8张图片

Sample Complexity

机器学习基石 - The VC Dimension_第9张图片

  • theory: N10000 dVC N ≈ 10000   d V C

  • practical: N10 dVC N ≈ 10   d V C often enough!

  • Looseness of VC Bound
    机器学习基石 - The VC Dimension_第10张图片

你可能感兴趣的:(机器学习基石)