西瓜书学习笔记(第一章)

  1. 基本术语
    数据集(data set): 所有数据的集合
    样本(sample): 描述某个事件或对象的记录
    属性(attribute): 事件或对象的某个性质
    属性值(attribute value): 性质的取值
    属性空间(attribute space): 性质所有取值的集合
    特征向量(feature vector): 由多个性质组成的一条记录
    训练数据(training data): 训练过程中使用的数据
    训练样本(training sample): 训练数据中的每一条记录
    训练集(training set): 训练样本组成的集合
    标记(label): 样本的结果信息,如“好瓜”,“坏瓜”
    分类(classification): 需要预测的结果是离散值,有限个预测结果
    二分类(binary classification)任务: 只有两类的分类任务
    多分类(multi-class classification)任务: 多个类的分类任务
    回归(regression): 需要预测的结果是连续值,在规定取值范围内可以有无 限个预测结果
    监督学习(supervised learning): 训练数据拥有标记信息
    无监督学习(unsupervised learning): 训练数据不含标记信息

你可能感兴趣的:(二狗编程入门之路,机器学习)