6.1多数据源的合并

        随着信息技术的发展和科技的进步,人类步入大数据时代,大数据作为当前高科技时代的产物,它的种类多而繁杂。,如果想要得到需要的数据,这些需要的数据有可能会来源于多个不同的数据源中,此时我们可以将多个数据源进行合并操作,从而获取到所需要的数据。

6.1多数据源的合并_第1张图片

        下面通过Kettle工具将A公司和B公司的手机日销数据合并到一个数据源(数据表company)中,也就是对文件company_a.csv(如上图)和数据表company_b(如下图)中的数据进行合并操作,并输出到数据表company中,具体操作如下。

6.1多数据源的合并_第2张图片

一,创建转换

6.1多数据源的合并_第3张图片

二,配置“CSV文件输入”控件

6.1多数据源的合并_第4张图片

三,字段选择

        “选择和修改”选项卡

6.1多数据源的合并_第5张图片

         ”元数据“选项卡

6.1多数据源的合并_第6张图片

四,表输入

6.1多数据源的合并_第7张图片

 五,排序合并

        按照id的升序排序,并把两个数据源合并。

6.1多数据源的合并_第8张图片

六,增加序列

        增加一个序列,默认名称valuename.

6.1多数据源的合并_第9张图片

 七,字段选择2

6.1多数据源的合并_第10张图片

八,表输出

6.1多数据源的合并_第11张图片

九,查看结果

6.1多数据源的合并_第12张图片

 

你可能感兴趣的:(数据清洗,etl)