周志华机器学习—绪论

基本术语

模型:从数据中学习得到的结果,指全局性结果
模式:指局部性结果
从数据中得到模型的过程称为学习或者训练,训练过程中使用的数据称为训练数据
其中的每一个样本称为训练样本,训练样本组成的集合称为训练集
某种潜在的规律称为假设
样例:例如我们需要判断某一个瓜是否是好瓜,(xi,yi),yi就是标记,yi的集合称为标记空间
分类:我们需要预测的值是离散值,例如是好瓜还是坏瓜,这种学习任务称为分类,如果预测的是连续值,例如西瓜的成熟度,这种学习任务是回归。两个类别分类的是正类,其他则是反类。多个类别是多分类任务。
学得模型之后,对其进行预测的过程是测试,被预测的样本是测试样本。

聚类:对训练中的西瓜分为若干组,每组称为一个。??有助于我们了解数据内在的规律,深入的分析数据。注意:在学习过程中,在学习过程中使用的训练样本不具有标记信息。

根据训练过程中是否具有标记信息,可以分为监督学习无监督学习分类回归是前者,聚类是后者。
**

机器学习的目标是什么?

**
更好的适用新样本,而不是仅仅用于训练样本。学到的模型适用于新样本的能力称为泛化能力。

假设空间

归纳:特殊—》一般,泛化过程
演绎:一般–》特殊,从基础原理到推到具体情况
从样例中学习的过程为归纳学习。
归纳学习
狭义归纳学习;从训练数据中学的概念,称为概念学习和概念训练。
广义归纳学习:从样例中学习

概念学习最基本的布尔概念学习:
我们可以把学习过程看做是一个在所有假设组成的空间中进行搜索的过程,

由于刚刚断网没有保存其他的就不写了。。

你可能感兴趣的:(机器学习,机器学习)