机器学习实战笔记-KNN

1、K近邻
优点:分类精度高、对异常值不敏感
缺点:计算量大,空间复杂度高
数值型和标称型数据
2、建模步骤
数据归一化:因计算距离,特征之间需无差别(特别注意点)
计算待测样本点与所有样本的距离,选取前k个,选取多数所占的类别
3、改进约会网站的配对结果
特征是人的特征,标签(喜欢,一般喜欢,不喜欢)
根据分类器,输入某个人的相应特征,可以判断出自己对他的情感状态,是否符合预期标准
4、手写识别系统
非图片类:每张图为一个矩阵,是由‘0’和‘1’构成,‘1’所在位置勾勒出数字1,2,3,,,9
图片标签是图片对应数字
5、模型
输入:
dataset:样本
label:标签
输出:待预测样本的预测标签

你可能感兴趣的:(机器学习)