绪论(0)

1. 训练集(trainingset),用来调节模型的参数,训练集中数字的类别实现已知,通常是被独立考察、人工标注的。

2. 目标向量(targetvector)t来表示数字的类别,它代表对应数字的标签。

3. 新的数字的图像集合组成了测试集(test set)。

4. 正确分类与训练集不同的新样本的能力叫做泛化(generalization)。

5. 训练数据的样本包含输入向量以及对应的⽬标向量的应用叫做有监督学习(supervisedlearning)问题。

6. 目标是给每个输入向量分配到有限数量离散标签中的⼀个,被称为分类(classification)。

7. 如果要求的输出由⼀个或者多个连续变量组成,那么这个任务被称为回归(regression)。

8. 训练数据由⼀组输⼊向量x组成,没有任何对应的⽬标值,称为⽆监督学习(unsupervised learning)。

9. 无监督学习(unsupervisedlearning)问题中,目标可能是发现数据中相似样本的分组,这被称为聚类(clustering),或者决定输入空间中数据的分布,这被称为密度估计(densityestimation),或者把数据从高维空间投影到二维或者三维空间,为了数据可视化(visualization)。


你可能感兴趣的:(PRML,学习笔记)