KNIME工作流的建立实验

1. 实验相关知识

1)安装完成KNIME。
2)双击桌面上KNIME图标,启动KNIME。
在这里插入图片描述
3)指定KNIME的工作区
工作区是指本地磁盘上的一个目录,用于存储KNIME工作流、节点设置和工作流生成的数据等。
KNIME工作流的建立实验_第1张图片
4)KNIME分析平台用户界面(KNIME工作台)
KNIME工作流的建立实验_第2张图片
由菜单栏、快捷工具栏、KNIME Explorer(项目资源管理器)、Workflow Coach(社区推荐的工作流节点)、Node Repository(节点存储仓库)、Workflow Editor(工作流编辑区)、Node Description(节点描述)、Outline(概览)、Console(控制台)组成。
5)节点和工作流
在KNIME分析平台中,单个任务由节点表示。每个节点都显示为一个带输入和输出端口的彩色框,以及一个状态。输入是节点处理的数据,输出是结果数据集。每个节点都有特定的设置,可以在配置对话框中调整这些设置。当配置时,节点状态将发生变化,每个节点下方的交通灯将显示该状态。节点可以执行各种任务,包括读取/写入文件、转换数据、培训模型、创建可视化等。
KNIME工作流的建立实验_第3张图片
一组相互连接的节点构成了一个工作流,并且通常表示特定数据分析项目的某些部分(或者全部)。
KNIME工作流的建立实验_第4张图片

2. 创建工作流

1)实验要求
(1)使用sales_data.csv文件,创建一个工作流。
在sales_data.csv文件中,包含:product(产品)、country(销售国家)、date(销售时间)、quantity(销售量)、amount(销售总量)、card(卡号)、Cust_ID(海关ID)。
在这里插入图片描述
(2)以sales_data.csv文件中的数据,生成一个销售总量随时间的堆叠面积图,一个在不同国家销售的饼图。
(3)作流命名为:sales
工作流命名由用户决定,工作流适当的命名,能反映该工作流所完成的工作。
2)创建工作流
使用菜单创建新的工作流
在这里插入图片描述
(1)主菜单:File-> New
(2)在向导中选择“New KNIME Workflow”,再选择“Next” KNIME工作流的建立实验_第5张图片
(3)输入工作流的名称:sales,选择“Finish” KNIME工作流的建立实验_第6张图片
sales为工作流的名称,KNIME将在工件区中创建一个与工作流同名的目录,用来存放该工作流的相关文件。
(4)在Explorer中,新建的工作流“sales”已经可见。 KNIME工作流的建立实验_第7张图片
工作流的删除
对于无用或误建的工作流,可以进行删除,方法是在“KNIME Explorer”中选中要删除的工作流,右键,在弹出菜单中选择“Delete”。
3)在工作流中添加第一个节点
(1) 在“KNIME Explorer”中,选择一个工作流:sales,此时工作流编辑器窗口为空。KNIME工作流的建立实验_第8张图片
(2)在“Node Repository”中选择“IO”,再选择“Read”,再选择“File Reader”,然后将其拖入工作流编辑器窗口。或双击“File Reader”。
KNIME工作流的建立实验_第9张图片
KNIME工作流的建立实验_第10张图片
(3)对该节点进行设置
在工作流编辑器窗口中双击该节点图标,或在该节点图标右键,打开“Configure”,在工作区中选择输入的文件名:C:\bdlab\sales_data.csv KNIME工作流的建立实验_第11张图片
然后“Apply” KNIME工作流的建立实验_第12张图片
数据已经的节点关联。
(4)此时节点并未读取文件,节点图标如下(没有绿灯)
KNIME工作流的建立实验_第13张图片
右键,在打开的弹出对话框中,选择:“Execute”,执行读取,执行读取后,图标如下(有了绿灯)。
KNIME工作流的建立实验_第14张图片
(5)将列筛选器节点(Column Filter)添加到工作流编辑器
选中“File Reader”节点,将“Workflow Coach”中的“Column filter”拖入工作流编辑器。
或直接双击“Column filter”,该方法将直接建立与“File Reader”的关联。 KNIME工作流的建立实验_第15张图片
4)将列筛选器(Column Filter)其连接到文件读取器(File reader)节点
选中文件读取器(File reader)节点的输出,按住鼠标左键,拖动至列筛选器(Column Filter)节点的输入。完成输入到输出的连接。 KNIME工作流的建立实验_第16张图片
5)配置列筛选器(Column Filter)
选中列筛选器(Column Filter),右键,在弹出菜单中选“Configure”。或双击列筛选器(Column Filter),直接打开“Configure” KNIME工作流的建立实验_第17张图片
在列筛选器(Column Filter)设置窗口中,左侧为输入数据所包含的列(有绿色框),右侧为输出不包含的列(有红色框),设置不包含的列的方法有二种:
法1:在右侧窗口中双击不包含的列,该列将自动移至右侧窗口中。
法2:在右侧窗口中选中不包含的列,单击“>”,该列将自动移至右侧窗口中。 KNIME工作流的建立实验_第18张图片
完成后按“OK”
6)将行筛选器节点(Row Filter)添加到工作流编辑器
选中“File Reader”节点,将“Workflow Coach”中的“Row filter”拖入工作流编辑器。 KNIME工作流的建立实验_第19张图片
7)将行筛选器(Row Filter)其连接到文件读取器(File reader)节点
选中文件读取器(File reader)节点的输出,按住鼠标左键,拖动至列筛选器(Row Filter)节点的输入。完成输入到输出的连接。 KNIME工作流的建立实验_第20张图片
8)配置行筛选器(Row Filter)
选中行筛选器(Row Filter),右键,在弹出菜单中选“Configure”。或双击列筛选器(Row Filter),直接打开“Configure” KNIME工作流的建立实验_第21张图片
在行筛选器(Row Filter)设置窗口中,设置输出中不包含未知国家的行。
KNIME工作流的建立实验_第22张图片
然后单击“OK”
至此,数据过滤已经设置完毕,继续进行数据可视化设置。 KNIME工作流的建立实验_第23张图片

9)堆叠面积图
在“Node Repository”中,选择“Views”,再选择“Java Script”,将“Stacked Area Chart(Java Script)”拖至工作流编辑器。 KNIME工作流的建立实验_第24张图片

10)完成输入输出连接 KNIME工作流的建立实验_第25张图片

11)设置堆叠面积图(Stacked Area Chart(Java Script))
双击堆叠面积图(Stacked Area Chart(Java Script)),或单击双击堆叠面积图(Stacked Area Chart(Java Script)),选择“Configure”,将时间设置为X轴。
KNIME工作流的建立实验_第26张图片
KNIME工作流的建立实验_第27张图片
然后,选择“OK”
12)饼图(JavaScript)
在“Node Repository”中,选择“Views”,再选择“Java Script”,将“Pie/Donut Chart(Java Script)”拖至工作流编辑器。完成连接。
KNIME工作流的建立实验_第28张图片
13)设置饼图(JavaScript)
KNIME工作流的建立实验_第29张图片

14)查看堆叠面积图可视化结果
选中“Stacked Area Chart”,右键,在弹出菜单中选择“Execute and Open Views” (如果该菜单为灰,先运行“Reset”)
KNIME工作流的建立实验_第30张图片

15)查看饼图可视化结果
选中“Pid/donut Chart”,右键,在弹出菜单中选择“Execute and Open Views” (如果该菜单为灰,先运行“Reset”)
KNIME工作流的建立实验_第31张图片

你可能感兴趣的:(KNIME应用)