(二)Talend读入文件

1.创建一个新工作

1. 确保已选择“ 集成”透视图。

2. 在项目存储库中,右键单击“ 作业设计”,然后在菜单中单击“ 创建标准作业 ”。

3. 在“新建作业”向导的“名称”字段中,将作业的名称填写为readCSVFile。

4. 优良作法是在作业中添加目的和描述。然后,单击完成以创建作业。

5. 作业设计器将打开一个空作业。

2.添加一个tFileInputDelimited组件

3.配置tFileInputDelimited_1组件

1. 在作业设计器中,单击tFileInputDelimited_1 。

2. 要定义组件的基本设置,在“组件”视图中,单击“ 组件”。属性类型定义如何读取数据源。文件名/流显示完整的输入或输出文件路径。可以手动键入路径,也可以使用省略号[..]按钮提供文件路径。行和字段分隔符定义行分隔符的类型。页眉和页脚指示文件中应忽略的行数。限制显示文件中要读取的最大行数。模式定义文件的数据结构。

3. 要指定要读取的文件的路径和名称,单击“文件名”字段旁边的[...],从本地磁盘中选择文件,然后单击“ 打开”。

4.定义tFileInputDelimited_1组件的架构

1. 要定义tFileInputDelimited_1组件的架构,单击“编辑架构”字段旁边的[...]。tFileInputDelimited_1向导的架构打开。[+]按钮向架构向导添加一列。[x]按钮从架构向导中删除选定的项目。[↑]和[↓]按钮在模式向导中上下移动所选项目。

2. 在架构向导中,单击[+]图标以添加一列。

3. 在“列”列中,将字段名称输入为movieID。

4. 要将此字段指定为键,选择键。

5. 在类型列中,单击整数。

6. 确保未选中Nullable列,以便拒绝该列的任何null值。

7. 在长度列中,输入4。

8. 对CSV文件中的每个字段重复步骤b至g。

9. 要关闭架构向导,单击确定。

5.添加日志记录组件并传播数据

1. 将tLogRow组件添加到作业。tLogRow组件将在控制台中显示其接收到的所有数据行。

2. 要将数据从tFileInputDelimited_1组件传播到tLogRow_1组件,在作业设计器中,右键单击tFileInputDelimited_1,按住并拖动到tLogRow_1。

3. 替代方法:要链接组件,也可以右键单击源组件,然后单击行>主。

6.运行工作

在作业readCSVFile的“运行”视图中,单击“运行”。

该文件由tFileInputDelimited组件读取,其内容由tLogRow组件显示在控制台上。

你可能感兴趣的:((二)Talend读入文件)