分享 | 实训课——创建并运行你的第一个KNIME工作流


前文《

分享 | KNIME:图形化数据科学与机器学习计算平台的王者

》对KNIME做了一个介绍,本次小音就带领大家创建并运行你的第一个KNIME工作流。


1、新建自己的第一个KNIME工程


点击菜单栏的“File”->“New”新建工程,按照如下指示可以很快地创建一个新的工程,如下图所示:



输入一个工程名称,如下图所示:



KNIME本身也提供很多案例工程,可以在“KNIME Explorer”窗口看到很多案例工程,运行这些工程,查看结果。你也可以从KNIME官网上下载案例工程,熟悉每个节点的使用,如下图所示:



2、打开并下载案例工作流


我们以下图的工作流为例。



双击“KNIME Explorer”窗口中的“EXAMPLES”从官网导入所有案例工作流,搜索并选择“Visual_Analysis_of_Sales_Data”工作流,双击打开。因为是打开远程的工作流,所以需要等一会儿。


成功打开后,界面上显示如下警告。因为打开的是远程工作流,对它的修改都无法保存,因此我们需要将它下载到本地。



点击菜单“File”-> “Save as…” 保存工作流至本地:



从图中看,先由“File Reader”读入数据,然后“Column Filter”和“Row Filter”对数据进行预处理。经过预处理后的数据是“Color Manager”和“Stacked Area Chart”两个节点的输入。

“Stacked Area Chart”直接将输入以图的方式展示出来,而“Color Manage”通过染色将它们按条件先进行区分,然后再由“Pie/Dount Chart”以饼图展示结果。



3、数据读入


当前工作流还没有被执行,所以所有节点的状态显示为黄色或者红色。选中“File Reader”节点,右击绿色的“Execute”按钮(快捷键Shift + F7),节点状态颜色变为绿色。右击带有放大镜的“Table Reader”按钮(快捷键Shift + F6),可查看读入的数据:




4、数据预处理


选中“Row Filter”节点,点击执行按钮,我们发现之前没有执行的节点也会自动执行,最后显示如下:

查看数据经过预处理后的结果:



5、数据可视化


选中“Color Manager”节点,双击打开设置界面,发现该节点以“country”列为条件,用不同颜色对数据进行分类标记,如下图所示。



执行该节点,点击“Table Reader”按钮,查看执行结果。



然后点击“Execute”按钮,工作流将按顺序执行全部节点。最后两个节点是可视化节点,选中他们后点击“Table Reader”按钮,就可以查看工作流运行的结果了。




本次创建并运行你的第一个KNIME工作流就到这里结束了,大家可以通过这个案例多熟悉下KNIME的基本操作。


下次实训课,小音将会以一个更加复杂的实例,讲解如何利用KNIME来处理一个实际的数据任务。


内容来源:嘉数会 

你可能感兴趣的:(分享 | 实训课——创建并运行你的第一个KNIME工作流)