Python机器学习基础教程(1)Irises(鸢尾花)分类之新手上路

一、感谢博客的内容提供的参考

标题:最新版学习笔记---Python机器学习基础教程(1)Irises(鸢尾花)分类---附完整代码

作者:非鱼子焉

地址:https://zhu-rui.blog.csdn.net/article/details/105900142

二、结合上课学习,划出理解的难点和重点

这一章太重要了,之前没太看懂的,现在有一点小懂,赶紧记录一下

(一)什么样的数据可以让机器分类

类别1 类别2 类别3 特点1 特点2 特点3 特点4
             

书上提供了一种花的数据,三个品种,对应的是四个特点,分别是花萼长度和宽度,花瓣长度和宽度

(二)怎么让机器学习

K近邻算法,就是用这个算法来学习所有的数据

简而言之,就是你用的大脑去测算一个人的品格时候,用的是什么标准。比如你用的是 核心价值观。

那么核心价值观就是那个算法,你用这个算法去学习分析了很多人之后,发现效果不错。现在一个新的人,你再次分析就行。

 这不就是模拟人的大脑么?

(三)一些只有机器 才能读懂的语言和程序学习,这部分很枯燥

先看看书,然后看看上面的参考,最后我给的完整代码,自己跑一下,OK就行

比如这个东东

  • data里面是花萼长度、花萼宽度、花瓣长度、花瓣宽度的测量数据,格式为NumPy数组
  • target数组包含的是测量过的每朵花的品种,品种被转换为0到2的整数,格式为NumPy数组
  • target_names键对应的值是一个字符串数组,里面包含我们要预测的花种
  • DESCR键对应的值是数据集的简要说明
  • feature_names键对应的值是一个字符串列表,对应一个特征进行了说明
  • filename键对应的值是数据集的存储位置

完整代码

import numpy as np
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
iris_dataset =load_iris()
X_train,X_test,y_train,y_test=train_test_split(iris_dataset['data'],
                                               iris_dataset['target'],random_state=0)
from sklearn.neighbors import KNeighborsClassifier 

knn=KNeighborsClassifier(n_neighbors=1)#这里我们设置邻居的数目为1

knn.fit(X_train,y_train)#构建模型

score=knn.score(X_test,y_test) #给模型打分,就是用这些数据模拟后搞了一个模型,反过来看看模拟特征对应的分类结果准不准

print("The rate of truth is ","{:.2f}".format(score))#展示给你们看我们的正确率

X_new = np.array([[5,2.9,1,0.2]])#书上一个新的花的四个特点,不知道属于哪个花
prediction = knn.predict(X_new)#马上应用我们的模型,看看属于什么花
print("prediction:{}".format(prediction))#展示出来结果

 

你可能感兴趣的:(新手上路,机器学习,python)