总结笔记--周志华《机器学习》第一章 绪论

1.基本术语

1.要进行机器学习,首先要获得数据集,以西瓜为例:


样本 色泽 根蒂 敲声 好坏
1 青色 蜷缩 浊响  
2 乌黑 稍蜷 沉闷  
3 浅白 硬挺 清脆  

如表格,此表格记录了西瓜的数据

数据集合称为数据集D={x1,x2,x3...xm}。每一行代表着一个示例(sample),(色泽,根蒂,敲声)为西瓜的属性(attribute),(青色,无黑)为属性值。

2.数据集由训练集和测试集组成,在学习的过程中我们得到的模型或算法称为”训练“,我们需要训练集示例组成的训练集得到模型,对测试集进行测试,预测的结果为”好“或者”坏“,称为标记。拥有了标记结果的示例,称为样本(example)。

3.预测的结果为离散型的如瓜的好坏,此类预测为”分类“(classification);若为连续型的称为“回归”(regression)。

4.学习任务可以分为:有监督学习,无监督学习和半监督学习。

你可能感兴趣的:(总结笔记--周志华《机器学习》第一章 绪论)