改进的二视图随机森林

摘要

随机森林(RF)是最经典的机器学习算法之一,并已获得广泛应用。然而观察发现,尽管现实中存在众多的二视图数据并已获得广泛的分析研究,但针对二视图场景的RF构建相当少,仅有的利用RF解决二视图学习问题的方法也都是先为各个视图生成各自的RF,在决策时才融合了视图间的信息。这样的方法存在一个显著不足是在其RF的构建阶段未利用两个视图间的相关性,这无疑浪费了信息资源。为了弥补这一不足,提出了一种改进的二视图随机森林(ITVRF)。具体而言,在决策树的生成过程中采用典型相关分析(CCA)进行视图融合,将视图间的信息交互融入到了决策树的构建阶段,实现了视图间互补信息在整个RF生成过程中的利用。此外,ITVRF还通过判别分析为决策树生成判别决策边界,更适合于分类。实验结果表明ITVRF比现有的二视图RF(TVRF)有着更优的准确率。

关键词: 决策树; 随机森林(RF); 二视图学习; 典型相关分析(CCA)

Breiman2001年首次提出的随机森林(random forest,RF[

你可能感兴趣的:(网络通信安全及科学技术专栏,随机森林,决策树)