SVM非线性分类案例

import numpy as np
import matplotlib.pyplot as plt
#读取数据
dataSet = np.genfromtxt('ex2data2.txt',delimiter=',')
# print(dataSet)
# x1 = dataSet[:,2]
x_data = dataSet[:,:-1]
y_data = dataSet[:,-1]
def plot():
    plt.scatter(x_data[y_data==0,0],x_data[y_data==0,1],c='r',marker='*',label='label0')
    plt.scatter(x_data[y_data==1,0],x_data[y_data==1,1],c='b',marker='^',label='label1')
    plt.legend()
plot()
plt.show()

SVM非线性分类案例_第1张图片

#引入SVM分类器
from sklearn import svm
#C代表对错误样本点的惩罚力度,C越大,代表惩罚越厉害
# model = svm.SVC(kernel='rbf',C=10000)
model = svm.SVC(kernel='rbf')
model.fit(x_data,y_data)
model.score(x_data,y_data)
# print(model.predict(x_data))
#gamma=1/2^2设的太大,会很小,高斯分布长得又高又瘦,会造成只会作用于支持向量样本附近,对于未知样本分类效果很差,存在训练准确率可以很高,(如果让无穷小,则理论上,高斯核的SVM可以拟合任何非线性数据,但容易过拟合

在这里插入图片描述

#可视化
'''
决策边界可视化
'''
#获取数据所在的范围
x_min,x_max = x_data[:,0].min()-1,x_data[:,0].max()+1
y_min,y_max = x_data[:,1].min()-1,x_data[:,1].max()+1

#利用meshgrid获取网格矩阵
#arange(start, end, step),与range()类似,也不含终止值。但是返回一个array对象
xx,yy = np.meshgrid(np.arange(x_min,x_max,0.02), 
                   np.arange(y_min,y_max,0.02))
# print('分割横坐标',np.arange(x_min,x_max,0.02))
# print('xx',xx)
# print('yy',yy.shape)
'''
np.r_按行进行组合array(上下)
np.c_按列进行组合(左右)
例如:
a = np.array([1,2,3])
b = np.array([5,2,5])
np.r_[a,b]
array([1, 2, 3, 5, 2, 5])
np.c_[a,b]
array([[1, 5],
       [2, 2],
       [3, 5]])
'''

x_new = np.c_[xx.ravel(),yy.ravel()]#reval将数据进行扁平化,将多维数据转化为1维
print(type(x_new))
z = model.predict(x_new)
# print(len(z))
z = z.reshape(xx.shape)#转化数组
#画出等高线图
cs = plt.contourf(xx,yy,z)#z代表高度,高度不一样显示的颜色也不一样
plot()
plt.show()

SVM非线性分类案例_第2张图片

你可能感兴趣的:(机器学习,python,机器学习,sklearn)