机器学习——感知机(笔记+代码)

机器学习——感知机

感知机模型定义:
1、输入空间这里写图片描述,目的是根据数据求出一个f(x),使得输入空间映射的输出空间;
这里写图片描述
这里写图片描述= 0时是一个超平面,该平面讲空间中的数据分成两类,这就是感知机的二分模型。我们的目的是找到一个当使得具有最好(在训练集上最好,)的分类效果。其中,这里写图片描述叫做权重向量(或者是法向量),这里写图片描述叫做偏移值(或者是截距)。
图例:

机器学习——感知机(笔记+代码)_第1张图片

参数的学习策略:
数据集:这里写图片描述,要求数据集线性可分。
目标:
这里写图片描述
我们的任何优化问题,都是基于损失函数最小化进行求解的,因此现在需要找到损失函数;
1、错误分类的点的个数,(不是w,b的连续可导函数,不易于优化,这个概念很重要)
2、错误分类的点到超平面的距离,(与上面相对,可以进行求导优化(梯度))
例如x0到超平面s的距离:
这里写图片描述
从上面目标可知,错误分类的点满足:这里写图片描述,因此误分类的点到超平面s的距离是:这里写图片描述,==> 总的误分类距离的和是这里写图片描述。M:是误分类的集合。
运算的时候,可以忽略确定的系数,因此这里写图片描述的损失函数可以定义为:
这里写图片描述
目标是最小化损失函数,求导得到极小值(专业点叫做随机梯度下降);
这里写图片描述
求解:
机器学习——感知机(笔记+代码)_第2张图片
注意:算法有可能会陷入局部最优。

Code:


# coding: utf-8

# In[4]:

import numpy as np
import scipy as sp
import matplotlib.pyplot as plt


# In[71]:

class Perceptron:
    trainSet = np.nan
    labels = np.nan

    w = 0
    b = 0


    def __init__(self):
       pass

    def plot(self):
        '''
        显示每一次的直线的位置
        '''

        for i in range(self.trainSet.shape[0]):
            if self.labels[i] == 1:
                plt.scatter(self.trainSet[i][0],self.trainSet[i][1],marker = 'o', s=200, c='red')
            else:
                plt.scatter(self.trainSet[i][0],self.trainSet[i][1],marker = 'x', s=200, c='black')

        x = np.arange(0, 5)
        y = -(x * self.w[0] + self.b) / self.w[1]
        plt.plot(x,y,c = 'blue')

        plt.show() # 显示训练的过程


    def plotAll(self):
        w = np.zeros(self.trainSet.shape[1])
        b = 0

        learnRate = 1
        flag = True
        length = self.trainSet.shape[0]

        i = 0
        while flag:
            flag = False
            for i in range(length):
                t = self.labels[i] * (np.sum(self.trainSet[i] * w) + b)
#                 print(t)
                if t <= 0: #错误分类的点,修改权重
                    w = w + learnRate * self.labels[i] * self.trainSet[i]
                    b = b + learnRate * self.labels[i]
                    flag = True
            print(w,b)

            i += 1
        # 修改类的值
            self.w = w
            self.b = b
             # plot
            for i in range(self.trainSet.shape[0]):
                if self.labels[i] == 1:
                    plt.scatter(self.trainSet[i][0],self.trainSet[i][1],marker = 'o', s=200, c='red')
                else:
                    plt.scatter(self.trainSet[i][0],self.trainSet[i][1],marker = 'x', s=200, c='black')

            x = np.arange(0, 5)
            y = -(x * self.w[0] + self.b) / self.w[1]
            plt.plot(x,y,c = 'blue')

        plt.show()


    def loadDataSet(self,trainData,labels):
        '''
        格式化训练数据
        '''
        return np.array(trainData), np.array(labels)



    def fit(self,trainData,label,learnRate=1):
        '''
        原始训练数据和labels,以及学习率(0 < learnRate <= 1)
        '''
        self.trainSet = np.array(trainData)
        self.labels = np.array(label)


        w = np.zeros(self.trainSet.shape[1])
        b = 0

        flag = True
        length = self.trainSet.shape[0]

        while flag:
            flag = False
            for i in range(length):
                t = self.labels[i] * (np.sum(self.trainSet[i] * w) + b)
#                 print(t)
                if t <= 0: #错误分类的点,修改权重
                    w = w + learnRate * self.labels[i] * self.trainSet[i]
                    b = b + learnRate * self.labels[i]
                    flag = True
#             print(w,b)
        # 修改类的值
            self.w = w
            self.b = b

#             self.plot()
        return w, b


    def predict(self,testSet):
        '''
        测试数据
        '''
        data = []
        if type(testSet[0]) is not list:
            data.append(testSet)

            testSet = np.array(data)
        else:
            testSet = np.array(testSet)

#         print(testSet, testSet.shape[0])
        result = []
        for i in range(testSet.shape[0]):
            a = np.sign(np.sum(self.w * testSet[i]) + self.b)
#             print(a,np.sum(self.w * testSet[i]) + self.b)
            result.append(a)

        return result


# In[72]:

perceptron =  Perceptron()
# [[1,1],[1,2],[2,1],[4,4],[4,5],[5,6]],[+1, +1, +1, -1, -1, -1]


# In[73]:

perceptron.fit([[1,1],[1,2],[2,1],[4,4],[4,5],[5,6]],[+1, +1, +1, -1, -1, -1])


# In[74]:

# perceptron.plotAll()


# In[76]:

perceptron.predict([[2,2],[1,2],[4,3]])

你可能感兴趣的:(机器学习笔记,Python笔记,机器学习,感知机,pyhton)