学习笔记(02):2019tensorflow2.0最新实战课程-机器学习基础

立即学习:https://edu.csdn.net/course/play/20753/259022

机器学习基础相关知识

一.训练数据、验证数据、测试数据

(一).建模前,我们吧数据分成三部分

1.训练集:训练集用来训练构建模型

2.验证集:验证集使用来在模型训练阶段测试模型的好坏

3.测试集:等模型训练好之后,在用测试集来评估模型的好坏

(如果分为两部分的话就是训练集和测试集)

二、监督学习和无监督学习和半监督学习

(一)监督学习:一般都有标签

(二)无监督学习:一般都没有标签 用来做聚类(如下图)

学习笔记(02):2019tensorflow2.0最新实战课程-机器学习基础_第1张图片

 

(三)半监督学习:是监督学习和无监督学习相结合的一种学习方式。主要是用来解决使用少量带标签的数据和大量没有带标签的数据进行训练和分类的问题

(现在用的比较少)

 

三、算法的应用

回归/分类/聚类

(一)回归:主要适用于解决预测未来的一些情况,比如说股票,房价等,之前有做过房价和天气预测的小项目所以这里还是比较懂的

(如下图)

学习笔记(02):2019tensorflow2.0最新实战课程-机器学习基础_第2张图片

(二)分类:主要有(图像识别、垃圾邮件分类、文本分类等等)根据前面数据的一些特征来判断类别

 

(三)聚类:根据一些没有标签的数据,来对数据进行分类,比如说在购物网站上购买一些数据,来对用户进行分类,比如VIP用户 或者普通用户等等,这里分类的数量视情况而定

 

总结:

(1)回归:预测数据为连续性数值

(2)分类:预测数据为类别型数据,并且类别已知

(3)聚类:预测数据为类别型数据,但是类别未知

回归和分类为监督性学习

聚类一般为为无监督性学习,也可以属于分类

 

四、建议:会碰到好多机器学习的应用,不太了解用哪一个方向,这是应该先想一下这个项目应该属于这三个种类中的哪一个,比如银行是否给用户放贷或者不放贷,因为结果只有两个情况,所以属于分类的问题,之后再想应该使用那一种算法来解决你这分类的事情,比如说神经网路、逻辑回归什么的,之后在考虑贷款的金额,这个就可以用分类解决也可以用回归来解决,也可以用回归来做,最好是用回归来做,因为这样会比较细,这样就会解决用户属于哪一类的人群。主要是思考问题属于什么种类,之后再想用哪种算法解决问题

你可能感兴趣的:(研发管理)