机器学习实战(基于scikit-learn和TensorFlow)学习心得(2)--机器学习系统的分类

机器学习系统的分类

第一种分类方法: 是否有人监督学习

监督学习: 每个被用于学习的数据都有其相应的类型,机器从每种类型的数据中总结出各自类型的特点用于进行判断. 垃圾邮件过滤器就是典型的监督学习,训练程序的邮件都被告知了其是不是垃圾邮件,而系统通过总结归纳垃圾邮件与正常邮件各自的特征从而形成一个判断器,当有新的邮件输入到系统中时,判断其会根据输入邮件的特征自动归类邮件.

另一类监督学习是回归预测,通过大量数据的统计整合拟合出曲线去预测曲线的走向,预测新冠肺炎的曲线就是通过用大量相似传染病数据整合出来的.

非监督学习: 非监督学习跟监督学习不同,输入数据没有任何标签,即没有相应的“正确答案”。从数据集中可以通过非监督学习得到数据的某种结构,可能是把数据分成两个不同的聚集簇,称为聚类算法

非监督学习另一个重要作用就是清理训练数据集,当有大量数据需要我们训练之前,为了减少异常数据对模型造成的影响,先用非监督学习将数据集分类以找出一场的数据拒绝,这样就可以增加机器学习的精确度.

还有一种介于监督和非监督之间的学习:半监督学习

半监督学习:常被用于社交网站图片分析,当你上传多张合照的时候,程序会非监督学习把不同照片上的同一个人分离归类出来,而你只需要告诉机器每个人是谁当有新的照片上传的时候机器就可以自动识别照片中的人了,这种学习既不需要每一个训练集都有信息但又需要某几个训练集有充分的信息.

加强学习:加强学习是一种十分不一样的学习方法,在这里我们先暂时放下.

第二类分类:学习的机器是否能在线升级

批量学习: 一次性批量输入给学习算法,当有新的数据需要让系统学习的时候我们需要重新从头训练系统,

在线学习(online learning),按照顺序,循序的学习,不断的去修正模型,进行优化。

在线学习的好处是系统能自动更新,但坏处是当有处心积虑的人要去破坏模型的时候,只需要持续输入不正确的数据就可以了.在线学习没有批量学习稳定.
而在线学习的的另一种好处是去中心化,不用把所有数据都集中储存在一起同时学习,可以分批次,分小块的进行学习.节省储存和计算资源.

第三种分类

instance-based:基于实例;先记住所有实例(训练数据),然后用相似度算法来泛化到新数据中;

model-based:基于模型;基于训练数据学习一个模型(函数),然后基于该模型来做预测;
基于实例的相当于一个判别器,他的基本作用是判别数据的特点并进行对比.
而模型的based相当于归类器,把相似的归成一类.
机器学习实战(基于scikit-learn和TensorFlow)学习心得(2)--机器学习系统的分类_第1张图片

你可能感兴趣的:(机器学习实战学习心得,机器学习,深度学习,python,算法)