译文地址:http://www.atyun.com/14092.html
源码地址:
https://github.com/susanli2016/Machine-Learning-with-Python/blob/master/Solving%20A%20Simple%20Classification%20Problem%20with%20Python.ipynb
数据集:
https://github.com/susanli2016/Machine-Learning-with-Python/blob/master/fruit_data_with_colors.txt
简单机器学习案例.几乎照着写了一遍,对最初认识机器学习还是有帮助的;
----------------------------------------------------------------------------
首先,导入数据集:
运行输出如下:
----------------------------------------------------------------------------
然后是各种画图,通过图像进行分析,
柱状图:
效果如下:
箱线图:
效果如下:
直方图:
效果如下:
关系图:
效果如下:
----------------------------------------------------------------------------
再然后是数据归一化:
接下来就是各种算法的拟合和评分了:
线性回归:(原文没有,自己加的看看的)
逻辑回归:
决策树:
KNN:
线性辨别分析:
高斯朴素贝叶斯:
支持向量机SVM:
算法们的评分输出:
根据上面的评分,发现KNN相对是最精确的,所以就用KNN做预测,用混淆矩阵查看报告
输出如下:
未完待续...