决策树算法

决策树算法_第1张图片

目录

​分类算法

决策树算法

外卖订餐决策树

分支处理


分类算法


        分类算法是利用训练样本集获得分类函数即分类模型(分类器),从而实现将数据集中的样本划分到各个类中。分类模型通过学习训练样本中属性集与类别之间的潜在关系,并以此为依据对新样本属于哪一类进行预测

决策树算法_第2张图片

决策树算法


决策树: 通过把数据样本分配到某个叶子结点来确定数据集中样本所属的分类

决策树由决策结点、分支和叶子结点组成:

决策结点表示在样本的一个属性上进行的划分;

分支表示对于决策结点进行划分的输出;

叶结点代表经过分支到达的类;

从决策树根结点出发,自顶向下移动 : 在每个决策结点都会进行次划分,通过划分的结果将样本进行分类,导致不同的分支,最后到达个叶子结点,这个过程就是利用决策树进行分类的过程

外卖订餐决策树


决策树算法_第3张图片

分支处理


往往使用启发式算法来进行决策树的构造

例如,使用贪婪算法对每个结点构造部分最优决策树

对于一个决策树的构建,最重要的部分就在于其分支处理,即确定在每个决策结点处的分支属性

分支属性的选取:即对决策节点上选择哪一个属性来对数据集进行划分,要求每个分支中样本的类别纯度尽可能高,而且不要产生样本数量太少的分支

你可能感兴趣的:(机器学习,算法,决策树)