Rattle :基于R的数据挖掘工具(2):功能概览

Rattle的界面,依次排列的是菜单,工具栏和标签栏。
 

1.Rattle的标签栏

一个完整的数据挖掘过程包括以下几个步骤(CRISP-DM,1996)
(1) 理解问题
(2) 理解数据
(3) 准备数据
(4) 建立模型
(5) 模型评估
(6) 运用

基于这个流程,Rattle开发了一个方便的标签栏,可以便捷的完成操作。

这个标签栏从左到右依次排列,各自完成数据挖掘的一个相关步骤。

Data:选择数据源,输入数据。
Explore:执行数据探索,理解数据分布。
Test:提供各种统计检验。
Transform:变换数据的形式。
Cluster:数据聚类,包括系统聚类,k-均值聚类,和双聚类(biclustering)。
Associate:关联规则方法。
Model:内容最丰富的一个标签。包括多种方法:决策树,支持向量机,线性模型,
神经网络,随机森林,提升(Boost)。
Rattle :基于R的数据挖掘工具(2):功能概览_第1张图片
 


Evaluate:模型评估,它会提供一个实际结果和预测结果进行比较的误差矩阵。
Log:数据挖掘过程的纪录。它可以给出所进行的Rattle操作的R代码,利用这个标签,可以学习R的数据挖掘过程,也可以把纪录以文本形式输出,在R 平台中实现R和Rattle的交互。

2.Rattle的工具栏和菜单
 Rattle工具栏上最主要的一个按钮是Execute按钮(执行)。所有的操作都要点击Execute来完成(对应的快捷键是F2)。

Report按钮,可以完成当前操作的格式化报告(以开放的标准ODT格式)。
Export按钮,可以输出来自Rattle的各种对象,特别的,完成Moel标签的相关操作后,它会以PMML格式保存当前模型。

Rattle工具栏和标签栏完成的大部分工作,使用菜单也可以完成。菜单很平凡,特别要指出的一点是,setting菜单中的Use Cario Graphics Device这一项要选中,这样图形才会以Rattle图形设备的形式输出,否则,会作为R图形输出。

你可能感兴趣的:(数据挖掘,语言,R语言,rattle)