4.1 抽取文本数据(TSV文件的抽取)

案例介绍:

通过Kettle工具抽取TSV文件tsv_extract.tsv中的数据保存至数据库extract中的数据表tsv中。

1.打开kettle工具,创建转换

通过使用Kettle工具,创建一个转换tsv_extract,添加“文本文件输入”控件、“表输出”控件以及Hop跳连接线,具体如图所示。

4.1 抽取文本数据(TSV文件的抽取)_第1张图片

2.配置文本文件输入控件

 双击“文本文件输入”控件,进入“文本文件输入”界面

4.1 抽取文本数据(TSV文件的抽取)_第2张图片单击【浏览按钮,选择要抽取的文件tsv_extract.tsv。单击增加按钮,将要抽取的TSV文件添加到转换“tsv_extract”中。

4.1 抽取文本数据(TSV文件的抽取)_第3张图片

 单击“内容”选项卡,清除分隔符处默认分隔符“;”并单击【Insert TAB】按钮,在分隔符处插入一个制表符;取消勾选“头部”复选框。

4.1 抽取文本数据(TSV文件的抽取)_第4张图片

单击预览记录按钮,查看文件tsv_extract.tsv的数据是否成功抽取到文本文件输入流中。

4.1 抽取文本数据(TSV文件的抽取)_第5张图片

3.配置表输出控件

双击“表输出”控件,进入“表输出”控件的配置界面。单击新建按钮,配置数据库连接,配置完成后单击确认按钮。

4.1 抽取文本数据(TSV文件的抽取)_第6张图片

单击目标表右侧的浏览按钮,获取目标表,即数据表tsv并勾选“指定数据库字段”复选框

4.1 抽取文本数据(TSV文件的抽取)_第7张图片

 单击“数据库字段”选项卡,再单击输入字段映射按钮,弹出“映射匹配”对话框,将“源字段”选项框的字段和“目标字段”选项框对应的字段进行映射匹配。

4.1 抽取文本数据(TSV文件的抽取)_第8张图片

4.1 抽取文本数据(TSV文件的抽取)_第9张图片

 “表输出”控件配置的最终效果,具体如图所示。

4.1 抽取文本数据(TSV文件的抽取)_第10张图片

4.运行tsv_extract转换

单击转换工作区顶部的运行按钮,运行创建的tsv_extract转换。

4.1 抽取文本数据(TSV文件的抽取)_第11张图片

5.查看tsv数据表中的数据

通过SQLyog工具,查看数据表tsv是否已成功插入五行数据。

4.1 抽取文本数据(TSV文件的抽取)_第12张图片

你可能感兴趣的:(kettle数据清洗案例,数据库)