决策树算法简介

应用场景:

公司正在招聘董事长助理一职。须先通过电话面试,了解应聘者基本情况,再决定是否发面试邀请,进行现场面试。

以下为通过初步电话面试之后,发出面试邀请的情况:

决策树算法简介_第1张图片


现有一位应聘者的属性为:学历不高(0),工作经验丰富(1),外语不好(0),

问:是否应该向他发送面试邀请?

基本原理:

通过历史电话面试数据确定决策树的结构,再将新的应聘者的数据“放”到这棵“树”中,确定最后是否发面试邀请。

基本原理拆解:

1)什么是“树”?

请参考“树”的简介。

2)如何画“树”?

最重要的,就是要确定各个节点的含义。比如招聘问题中,在根节点上,是优先根据学历将应聘者分类还是根据工作经验来分类呢?答案是,我们给每种分类方式打分。

3)简述画的过程:

在根节点,为各个条件打分:学历(5分)、工作经验(7分)、外语(6分)。假设我们希望选取分数最高的,那么根节点就应该通过工作经验来分类。在根节点之后,再对学历和外语重新打分(树的结构变了,条件的分值也会变)。学历(3分)、外语(7分),第二层通过外语来分类。第三层通过学历。

具体如何打分,请参考ID3、C4.5和CART

将数据层层分类之后如下图所示:

决策树算法简介_第2张图片

学历即为叶节点,根据叶节点是否发邀请的人数确定该路径的判定结果,绿色为发邀请,红色为不发邀请。

其中有两个叶节点发送与不发的人数相同,暂且定为发吧,急需招人。。。

我们看到共有六个叶节点,五个发送邀请,一个不发邀请。

现在,决策树已经搭建完毕,可以将我们的数据{学历不高(0),工作经验丰富(1),外语不好(0)}“放”到“树”里了。。。

路径为右左右,应该走到,结论是发邀请。






你可能感兴趣的:(决策树算法简介)