决策树技术及当前研究方向

数据挖掘中可以用“决策树”技术进行归纳分类。

1.决策树的构造:

   常用的算法有:ID3,C4.5,CART(贪心方法,非回溯的);可伸缩性比较好的有:SLIQ和SPRINT,雨林,BOAT。其中BOAT是可以增量更新的。

 

2.决策树的约简:

   减小错误修剪法,悲观错误修剪法,基于代价-复杂度的修剪法,代价敏感的决策树修剪法......

   简化决策树的方法绝不止这些,各种不同的方法觉有自己的优点和缺点。实际运用时应根据实际情况进行选择,当然算法也是,毕竟算法也都有各自的应用领域。(所以,如果要进行这方面的理论创新,应该基于实际的应用,有项目的话,更好。)

 

3.决策树目前主要的研究方向:

  1)与其他技术的结合:

        决策树与神经网络的结合:通过先生产决策树,然后根据决策树来重新构造多层神经网络,以加快神经网络的训练速度。相反,也可以用神经网络来得到所需的决策树,此法解决了由神经网络得到的知识难于被人们理解的缺点。

 

        决策树与模糊集合原理的结合   决策树不稳定,这样两者结合,弥补它的不足,(参考软决策树)

 

        决策树与进化算法,遗传算法及遗传编程的结合  可以较好的在并行计算机上运行,提高运算能力,进化算法为随机算法,对同一数据集可以产生不通的决策树,这样可以从中选择一个最优的。....

 

        决策树技术与多智能体的结合, 不多见,多智能体系统比较复杂,但机器学习有潜力提供一个鲁棒性较强的机制来有效协调各智能体间的行为,因此对多智能体结合机器学习是一个很有前途的方向(不理解)  

 

  2)寻找新的构造决策树的方法   与其他技术结合时,可以根据其他技术的特点重新构造适合融合的树的结构

 

  3)寻找更好的简化决策树的方法

 

  4)研究产生决策树的训练 和检验数据大小及特性与决策树特性之间的关系    数据预处理技术

 

  5)不确定环境下决策树研究

 

  6)决策树时间复杂度与准确性之间的矛盾

 

  7)决策树技术的软件实现

 

   当然这些研究也不是孤立的,它们常常相互联系,相互结合。

 

 

参考文献:决策树技术及其当前研究方向    John Durkin  ,  蔡竞峰 , 蔡自兴

你可能感兴趣的:(数据挖掘,算法,网络,数据挖掘,编程,c)