第四章 CSV文件抽取和JSON文件抽取

目录

一.csv文件抽取

        1.在数据库中新建表csv

        2.打开kettle工具,新建转换,并添加以下控件

        3.点击进入csv文件输入控件,进行配置

        4.点击表输出控件,进行配置

        5.保存运行

二.JSON文件抽取

        1.json文件简介

        2.数据库中建立表格

        3.打开kettle工具,新建转换并建立控件

        4.配置"JSON Input"控件

        5.配置"JSON input2控件"

        6.配置表输入控件

        7.保存运行


一.csv文件抽取

        1.在数据库中新建表csv

        

         2.打开kettle工具,新建转换,并添加以下控件

        第四章 CSV文件抽取和JSON文件抽取_第1张图片

        3.点击进入csv文件输入控件,进行配置

         (1)点击浏览,添加文件(csv_extract.csv)

         (2)点击下方获取字段,添加字段

     第四章 CSV文件抽取和JSON文件抽取_第2张图片

           

            (3)点击预览,查看记录,如下:

     第四章 CSV文件抽取和JSON文件抽取_第3张图片

             (4)点击确定,csv文件输入控件配置完成。

        4.点击表输出控件,进行配置

             (1)连接数据库

             (2)选择目标表,目标表为步骤一中准备的表csv

               (3)勾选指定数据库字段

       第四章 CSV文件抽取和JSON文件抽取_第4张图片

             (4)点击下方数据库字段,出现如下弹窗

      第四章 CSV文件抽取和JSON文件抽取_第5张图片

            (5)点击输入字段映射,进入映射匹配界面

      第四章 CSV文件抽取和JSON文件抽取_第6张图片

            (6)点击源字段与目标字段中数据,再点击Add将其添加到映射框中

      第四章 CSV文件抽取和JSON文件抽取_第7张图片

            (7)点击确定(有2次)

        5.保存运行

            (1)运行结果:

      第四章 CSV文件抽取和JSON文件抽取_第8张图片

             (2)数据库中抽取结果(部分)

      第四章 CSV文件抽取和JSON文件抽取_第9张图片

二.JSON文件抽取

       1.json文件简介

            json是JavaScript Object Notation的简写,翻译过来就是js对象简谱,简单点来说就是

        一种轻量级的数据交换格式。json格式文件就是后缀名为.json的文件。

        2.数据库中建立表格

                   

        3.打开kettle工具,新建转换并建立控件

        第四章 CSV文件抽取和JSON文件抽取_第10张图片

        4.配置"JSON Input"控件

            (1)进入配置界面

         第四章 CSV文件抽取和JSON文件抽取_第11张图片

             (2)点击浏览,添加要处理的文件,并点击增加

         第四章 CSV文件抽取和JSON文件抽取_第12张图片

            (3)点击字段手动添加以下内容并预览结果

         第四章 CSV文件抽取和JSON文件抽取_第13张图片

             (4)点击确定

        5.配置"JSON input2控件"

            (1)点击进入配置界面

          (2)填写从字段获取源选项

          第四章 CSV文件抽取和JSON文件抽取_第14张图片

            (3)点击字段,填写如下内容

          第四章 CSV文件抽取和JSON文件抽取_第15张图片

             (4)点击确定

        6.配置表输入控件

            (1)选择目标表(json表)

            (2)勾选指定数据库字段

           第四章 CSV文件抽取和JSON文件抽取_第16张图片

             (3)点击数据库字段,并点击输入字段映射,结果如下

           第四章 CSV文件抽取和JSON文件抽取_第17张图片

           第四章 CSV文件抽取和JSON文件抽取_第18张图片

             (4)点击确定

        7.保存运行

            运行结果:

               第四章 CSV文件抽取和JSON文件抽取_第19张图片

             数据库中抽取结果:

                                   第四章 CSV文件抽取和JSON文件抽取_第20张图片

        

你可能感兴趣的:(etl,大数据,数据库)