Machine Learning Course-CS 156 笔记 5

Lecture 5 : Training versus Testing

视频地址:https://www.youtube.com/watch?v=SEYAnnLazMU

  • Lecture 5 Training versus Testing
    • 测试与训练
    • examples
    • break point
    • 结论


测试与训练

用期末考试举例。
测试:

P[|EinEout|>ϵ]2e2ϵ2N P [ | E i n − E o u t | > ϵ ] ≤ 2 e − 2 ϵ 2 N

训练:
P[|EinEout|>ϵ]2Me2ϵ2N P [ | E i n − E o u t | > ϵ ] ≤ 2 M e − 2 ϵ 2 N

M M 从哪里来?
不好的事件 Bm B m 是 ’ |EinEout|>ϵ | E i n − E o u t | > ϵ

联合边界:

P[B1B2BM]P[B1]+P[B2]++P[BM] P [ B 1 ∪ B 2 ∪ ⋯ ∪ B M ] ≤ P [ B 1 ] + P [ B 2 ] + ⋯ + P [ B M ]

可以在 M M 上进行改进吗?
不好的事件非常重叠。
Machine Learning Course-CS 156 笔记 5_第1张图片
蓝线和绿线是两个分界面。
ΔEout:+11ΔEin:|Ein(h1)Eout(h1)||Ein(h2)Eout(h2)| Δ E o u t : + 1 和 − 1 区 域 的 改 变 Δ E i n : 数 据 点 标 签 的 改 变 | E i n ( h 1 ) − E o u t ( h 1 ) | ≈ | E i n ( h 2 ) − E o u t ( h 2 ) |

替代 M M
用输入点的有限集合来替代所有的输入空间,并且计算二分法(假设)的数量

二分法:微型假设
一个假设 h:X{1,+1} h : X → { − 1 , + 1 }
一个二分 h:{x1,x2,,xN}{1,+1} h : { x 1 , x 2 , ⋯ , x N } → { − 1 , + 1 }

假设集 |H| | H | 的数量无限的。
二分集合 |H(x1,x2,,xN)| | H ( x 1 , x 2 , ⋯ , x N ) | 的数量最多为 2N 2 N

The growth function
计算了 N N 点上最多的二分集

mH(N)=maxx1,,xNX|H(x1,,xN)| m H ( N ) = max x 1 , ⋯ , x N ∈ X | H ( x 1 , ⋯ , x N ) |

growth function满足 : mH(N)2N m H ( N ) ≤ 2 N

  • mH(3)=8 m H ( 3 ) = 8
  • mH(4)=14 m H ( 4 ) = 14 (当+1点在对角线上时无法分割)

examples

1.射线
Machine Learning Course-CS 156 笔记 5_第2张图片

Hh:R{1,+1}h(x)=sign(xa)mH(N)=N+1 H 是 h : R → { − 1 , + 1 } 的 集 合 h ( x ) = s i g n ( x − a ) m H ( N ) = N + 1

2.区间
Machine Learning Course-CS 156 笔记 5_第3张图片

Hh:R{1,+1}mH(N)=C2N+1+1=12N2+12N+1 H 是 h : R → { − 1 , + 1 } 的 集 合 m H ( N ) = C N + 1 2 + 1 = 1 2 N 2 + 1 2 N + 1

3.凸集
Machine Learning Course-CS 156 笔记 5_第4张图片

Hh:R2{1,+1}mH(N)=2N H 是 h : R 2 → { − 1 , + 1 } 的 集 合 m H ( N ) = 2 N

根据下图理解:
Machine Learning Course-CS 156 笔记 5_第5张图片
N N 个点被凸集“shatter”了

mH(N) m H ( N ) 替代 M M 时会怎样?
只需证明 mH(N) m H ( N ) 是多项式


break point

定义: 如果没有大小为 k k 的数据集可以被 H H ‘shatter’,那么 k k 就是 H H 的一个break point

对于2维的感知机,break point是 k=4 k = 4

继续前面的例子:

  • 对于射线 mH(N)=N+1 m H ( N ) = N + 1 , break point 是 k=2 k = 2
  • 对于区间 mH(N)=12N2+12N+1 m H ( N ) = 1 2 N 2 + 1 2 N + 1 , break point 是 k=3 k = 3
  • 对于凸集 mH(N)=2N m H ( N ) = 2 N , break point 是 k= k = ∞

结论

没有break point mH(N)=2N ⟹ m H ( N ) = 2 N
有break point mH(N) ⟹ m H ( N ) N N 的多项式

你可能感兴趣的:(机器学习)