【学习记录】python感知机

用python实现感知机

输入参数:
1)学习率 eta : float
2)遍历训练集次数:n_iter : int
3)随机权重初始化种子:random_state : int

import numpy as np

class Perceptron(object):
    def __init__(self, eta=0.01, n_iter=50, random_state=1):
        self.eta = eta
        self.n_iter = n_iter
        self.random_state = random_state

    def fit(self, X, y):
        rgen = np.random.RandomState(self.random_state)
        self.w_ = rgen.normal(loc=0.0, scale=0.01, size=1 + X.shape[1])
        self.errors_ = []

        for _ in range(self.n_iter):
            errors = 0
            for xi, target in zip(X, y):
                update = self.eta * (target - self.predict(xi))
                self.w_[1:] += update * xi
                self.w_[0] += update
                errors += int(update != 0.0)
            self.errors_.append(errors)
        return self

    def net_input(self, X):
        """Calculate net input"""
        return np.dot(X, self.w_[1:]) + self.w_[0]

    def predict(self, X):
        """Return class label after unit step"""
        return np.where(self.net_input(X) >= 0.0, 1, -1)
   

主要函数 fit

1)rgen
为 numpy 的随机数生成器

2)self.w_
初始化权重

rgen.normal(loc=0.0, scale=0.01, size=1 + X.shape[1])
产生标准差为0.01的正态分布

3)self.errors_ = []
会把每次迭代中收集的分类错误记入 self.errors_ 列表

函数 net_input
np.dot 用于计算 向量点积 wT x

不把权重初始化为零的原因:
权重为非零值,学习率才会影响分类结果
如果所有的权重都初始化为零,那么学习率只会影响权重向量的大小,而不会影响其方向

感知机原理参考链接

你可能感兴趣的:(机器学习基础,python,学习,numpy)