(三)Talend排序文件

1.创建一个新工作

1. 确保已选择“ 集成”透视图。

2. 创建一个新的Job并将其命名为SortCSVFile。

3. 作业设计器将打开一个空作业。

2.添加并配置tFileInputDelimited组件

1. 将tFileInputDelimited组件添加到作业。

2. 要配置一个tFileInputDelimited_1组件,在该组件的Component视图中,单击FileName字段旁边的[...] ,从本地磁盘中选择文件,然后单击Open。

3. 要描述文件的结构,打开tFileInputDelimited_1的Schema向导,然后单击Edit schema字段旁边的[...]。

4. 单击[+]图标添加第一列,然后输入该列的详细信息。

5. 对CSV文件中的每一列重复步骤d,然后关闭“架构”向导。

3.对作业中的数据进行排序

1. 将tSortRow组件添加到Job并链接两个组件。注意:tFileInputDelimited_1组件的架构由链接的tSortRow组件继承,无需对其进行配置。

2. 要查看已继承的架构,在tSortRow组件的“组件”视图中,单击“编辑架构”旁边的[…]。

3. 要基于电影发行年份创建新的排序规则,单击[+],然后在“模式”列中单击releaseYear并通过单击desc指定排序顺序。

4. 要查看排序规则的结果,在作业设计器中添加一个tLogRow组件并链接tSortRow_1和tLogRow_1组件。

5. 要运行作业,在“作业”排序CSV文件的“运行”视图中,单击“运行”。

6. 现在,源文件中的电影将根据发行年份进行排序。

4.添加第二个排序规则

1. 要添加第二个排序规则,在tSortRow_1组件的“组件”视图中,单击(+),然后在“架构”列中选择标题。然后在排序列中,选择alpha。

2. 要运行作业,在“运行”视图中单击“运行”。

3. 现在,将按发行年份对电影进行排序,并且在每年内,将按电影标题的字母顺序对电影进行排序。

5.将作业的结果存储在文件中

1. 将tfileOutputExcel组件添加到作业设计器中,并将tLogRow_1链接到该组件。

2. 要配置输出组件,在组件的“组件”视图中,指定输出文件的路径和名称。

3. 要将标题行包含在输出文件中,选择Include Header。

4.要运行作业,在“运行”视图中单击“运行”。

5. 要检查moviesSorted.xls文件,导航到在其中创建文件的文件夹并打开文件。将显示带有排序数据的文件。

6. 为了防止排序的数据显示在“运行”视图中,右键单击tLogRow_1,然后单击停用tLogRow。

7. 要运行作业,在“运行”视图中单击“运行”。

作业再次运行。但是,“运行”视图中没有显示任何数据。

你可能感兴趣的:((三)Talend排序文件)