其中sign符号函数为:
w和b为感知机模型参数,也是感知机要学习的东西。w和b构成的线性方程wx+b=0极为线性分离超平面。
有且仅在数据线性可分的情况下,感知机才能奏效。感知机模型简单,但这也是其缺陷之一。所谓线性可分,也即对于任何输入和输出数据都存在某个线性超平面wx+b=0能够将数据集中的正实例点和负实例点完全正确的划分到超平面两侧,这样数据集就是线性可分的。 感知机的训练目标就是找到这个线性可分的超平面。为此,定义感知机模型损失函数如下:
要优化这个损失函数,可采用梯度下降法对参数进行更新以最小化损失函数。计算损失函数关于参数w和b的梯度如下:
完整的感知机算法包括参数初始化、模型主体、参数优化等部分,我们便可以按照这个思路来实现感知机算法。在正式写模型之前,我们先用sklearn的iris_data准备一下示例数据。
class Perceptron:
def __init__(self):
pass
def sign(self, x, w, b):
return np.dot(x, w) + b
def train(self, X_train, y_train, learning_rate):
# 参数初始化
w, b = self.initilize_with_zeros(X_train.shape[1])
# 初始化误分类
is_wrong = False
while not is_wrong:
wrong_count = 0
for i in range(len(X_train)):
X = X_train[i]
y = y_train[i]
# 如果存在误分类点
# 更新参数
# 直到没有误分类点
if y * self.sign(X, w, b) <= 0:
w = w + learning_rate*np.dot(y, X)
b = b + learning_rate*y
wrong_count += 1
if wrong_count == 0:
is_wrong = True
print('There is no missclassification!')
# 保存更新后的参数
params = {
'w': w,
'b': b
}
return params