(五)Talend使用tMap组件过滤数据

1.创建一个新的Job,添加电影元数据作为输入源,并添加一个tMap组件

a. 创建一个名为tMapFilter的新标准作业。

b. 将电影元数据文件添加为输入分隔的组件。

c. 添加可以修改架构和过滤器列的tMap组件。

d. 通过链接两个组件,从电影组件到tMap_1组件创建数据流。

2.配置tMap_1组件以过滤列

a. 双击tMap_1组件。tMap_1向导窗口包含四个主要部分:-左侧部分显示传入的数据流。请注意,tMap组件中可以有多个输入。-中间部分显示输入和输出数据流之间的映射链接。在这里,您还可以创建使用输入值的变量,然后将其用于产生输出。-右侧显示输出数据流。-底部是模式编辑器,可用于修改输入或输出流的模式。要编辑模式,请选择要更改其模式的输入/输出流(所选流以黄色突出显示),然后在模式编辑器中编辑该模式。。

b. 为了创建一个新的输出分量,在tMap_1向导的输出部分中,点击[+]按钮,键入输出的名称filteredOutput,并点击OK。将创建一个空输出。

c. 要将列添加到输出,请在输出的模式编辑器中单击[+]图标。

d. 为影片ID定义一列(Column:movieID,Type:Integer,Length:4)。注意:输出列名称不必与输入列名称相同。要更改列名,请在模式编辑器中编辑条目。

e. 要将数据从输入文件的movieID列发送到输出列,请单击movieID,按住并拖动到filteredOutput的“表达式”列。出现黄色箭头,指示数据流。

f. 要将title和releaseYear列添加到输出组件并将其链接,请选择这些列并将其从输入组件拖到输出组件。

g. 要更改输出组件中列的顺序,请单击[↑]或[↓]图标。列顺序和相应的链接将被更新。

3.使用配置的tMap_1组件

a. 要显示由tMap_1组件处理的输出,请在作业设计器中添加一个tLogRow组件,并将tMap_1组件的filteredOutput输出链接到tLogRow_1组件。

b. 要运行作业,请在“运行”视图中单击“运行”。

c. 仅显示过滤后的电影数据(movieID,releaseYear和title)。

你可能感兴趣的:((五)Talend使用tMap组件过滤数据)