02、Learning to Answer Yes/No

Road Map

机器学习算法A会看资料D和假设集合H,然后在H里面选一个g。现在我们来看机器是如何处理是非题。(二分类

What hypothesis can we use?

那么我们的来看一个模型,看看这个H长什么样。

用户的申请表

x = (x1,x2,...,xd),这些是features of customer, 乘上一个权重w,来计算score。
判定规则

y:{+1(good),-1(bad)}。

通过将右边的threshold移到左边就可以知道,如果左边项 > 0,那么 y=1;如果左边项 < 0,那么y=-1。这也可以用sign函数来表示。(这里如果左边项 = 0,其实这个不重要,y可以随便等于1或者-1)

Perceptron

上面的这个公式叫做感知机Perceptron,h与w和threshold有关,不同的w与threshold取值就可以确定不同的h。(w是一个矩阵

下面进行一个符号上的简化。

简化步骤

具体来看一下h。

二维空间里的感知器

x:在平面上的点(这个点在d维空间里)
y:O(+1),X(-1)
h:lines(或者是在d维空间里的超平面)
h的一边是预测成+1,另一边是预测成-1。

(问题:这里的h是H吗?这里的d维空间或者d+1维空间需要分得很清楚吗,因为前面刚才提到过x0和w0)

习题:

习题

答案是2。+1代表的spam。如果想要很大的权重,说明这些单词在spam里面经常出现的。

你可能感兴趣的:(02、Learning to Answer Yes/No)