python knn模型_使用Python训练KNN模型并进行分类

K临近分类算法是数据挖掘中较为简单的一种分类方法,通过计算不同数据点间的距离对数据进行分类,并对新的数据进行分类预测。我们在之前的文章《K邻近(KNN)分类和预测算法的原理及实现》和《协同过滤推荐算法的原理及实现》两篇文章中都详细介绍过。本篇文章将介绍在python中使用机器学习库sklearn建立K临近模型(k-NearestNeighbor)的过程并使用模型对数据进行预测。

准备工作

首先是开始前的准备工作,导入我们需要使用的库文件。这里一共需要使用5个库文件。第一个是机器学习库,第二个是用于模型检验的交叉检验库,第三个是数值计算库,第四个是科学计算库,最后是图表库。

#导入机器学习KNN分析库

from sklearn.neighbors import KNeighborsClassifier

#导入交叉验证库

from sklearn import cross_validation

#导入数值计算库

import numpy as np

#导入科学计算库

import pandas as pd

#导入图表库

import matplotlib.pyplot as plt

读取并查看数据表

读取并导入所需数据,创建名为knn_data的数据表,后面我们将使用这个数据对模型进行训练和检验。

#读取并创建名为knn_data的数据表

knn_data=pd.DataFrame(pd.read_csv('knn_data.csv'))

使用head函数查看数据表的内容,这里只查看前5行的数据,数据表中包含三个字段,分别

你可能感兴趣的:(python,knn模型)