李宏毅机器学习笔记:机器学习介绍

前言

本文记录了关于机器学习的基本介绍,机器学习的一个基本的框架以及机器学习的相关技术,并且本文是基于台湾李宏毅机器学习课程的基础上所做的笔记。

一、机器学习介绍

  • 机器学习是什么

机器学习的本质其实就是在寻找一个Function,这个Function可以满足我们的期望:输入一个特定的值,输出我们所需要的,比如在自然语言方面输入一段语音期望能够识别出语音的内容,在图像识别方面,输入图像期望输出图像内容的类别等等
李宏毅机器学习笔记:机器学习介绍_第1张图片

  • 机器学习的总体过程

机器学习的总体过程可以分为三个部分:第一找到特定的Function;第二衡量Function的性能好坏;第三挑选出最优的Function

二、机器学习的分类

  • 机器学习总体分为以下几大类

机器学习可分为:监督学习、无监督学习、半监督学习、强化学习、迁移学习,当然这是个人认为仅仅代表个人观点;其中深度学习事实上是本事属于机器学习的内容,只不过深度学习在后来的研究中专门拿出来另起炉灶,深度学习的前身就是机器学习中的神经网络,当然个人认为目前大多数的深度学习都属于监督学习的范畴,大都建立在大数据集的基础上。

  • 监督学习

监督学习的官方一点的解释就是:根据已有的数据集,知道输入和输出结果之间的关系,根据这种已知的关系,训练得到一个最优的模型。也就是说,在监督学习中训练数据既有特征(feature)又有标签(label),通过训练,让机器可以自己找到特征和标签之间的联系,在面对只有特征没有标签的数据时,可以判断出标签。通俗一点讲就是,我们在不断地教机器做事。监督学习大体也可以分为回归和分类两大类型,这两个的任务基本上也都是建立在大数据的基础上,比如回归任务中的房价预测,得先收集足够多的过去的房价数据才可以对未来的房价进行预测;在分类任务中对图像内容进行二分类或者多分类,同样是通过收集足够多的样本图像并注明该图像的内容所属,才可对新的图像进行一个分类。

  • 无监督学习

无监督学习就是监督学习的反例,就是没有人教,给了他数据但是没有人告诉机器这些数据是属于什么,无监督学习更像是在自学不断地碰壁不断地总结规律。比如机器学习中的经典算法聚类算法,KNN,Kmeans等都是属于无监督学习。

  • 半监督学习

半监督学习就是给定两类数据集一类是有标注的数据另一类是无标注的数据,因为在现如今社会大多数的数据集基本上不可能全是有标注也不可能全是无标注,因此半监督学习就是监督学习和无监督学习的一种融合,在做训练的时候通过有标注数据来辅助无标注数据的拟合或者训练。

  • 迁移学习

迁移学习就是把已训练好的模型(预训练模型)参数迁移到新的模型来帮助新模型训练。考虑到大部分数据或任务都是存在相关性的,所以通过迁移学习我们可以将已经学到的模型参数(也可理解为模型学到的知识)通过某种方式来分享给新模型从而加快并优化模型的学习效率不用像大多数网络那样从零学习。

  • 强化学习

强化学习一个叫很经典的例子就是人工智能的围棋,Alpha Go那样的人工智能使用的就是强化学习,强化学习和监督、非监督不同,强化学习没有所谓的标注,有的是奖励和惩罚,也可以看作是分数,给机器数据让机器走,如果做的好就奖励或者分数更高,做不好就惩罚分数更低。
李宏毅机器学习笔记:机器学习介绍_第2张图片

你可能感兴趣的:(机器学习,机器学习)