判定树归纳算法描述

ID3版本:

算法:Generate_decision_tree 由给定的训练数据产生一棵判定树。
输入:训练样本samples,由离散值属性表示;候选属性的集合attribute_list。
输出:一棵判定树。
方法:
(1)创建节点N;
(2)if samples 都在同一分类C中,then
(3)返回N作为叶子节点,以分类C标记;
(4)if attribute_list 为空,then
(5)返回N为叶子节点,标记为samples中最普通的类;//多数表决
(6)选择attribute_list中具有最高信息增益的属性test_attribute;
(7)标记节点N为test_attribute;
(8)for each test_attribute中的已知值Ai//划分sample
(9)由节点N长出一个条件为test_attribute = Ai的分支;
(10)设Si是samples中的test_attribute = Ai的样本的集合;
(11)if Si为空 then 加上一个树叶,标志samples中的最普通的分类;
(12)else 加上一个由Generate_decision_tree(Si,attribute_list-test_attribute)返回的节点;

你可能感兴趣的:(数据挖掘算法)