4.2Kettle数据抽取——XML文件的数据抽取

XML是一种可扩展标记语言,也是一种元标记语言。

所谓“元标记”,就是开发者可根据自己的需要自定义标记。XML 是一种很像 HTML 的标记语言,但是它们也有很大的区别,如 XML被设计出来,主要用于传输和存储数据,其焦点是数据的内容,HTMI被设计出来,主要用于显示数据,其焦点是数据的外观;XML 中的标签是没有被预定义的,都是由 XML 文档的创作者发明的,HTML中的标签是预定义的,其文档中使用的标签必须是在 HTML标准中定义过的,用户自己定义的标签是不可使用的。

现有一个XML文件,名为xml_extract,具体内容如下

4.2Kettle数据抽取——XML文件的数据抽取_第1张图片

下面将分布演示如何抽取XML文件中的数据并保存至数据库中。

1.打开kettle工具,创建转换xml_extract,并添加如下控件及Hop跳连接线

4.2Kettle数据抽取——XML文件的数据抽取_第2张图片

2.配置Get data from XML控件

4.2Kettle数据抽取——XML文件的数据抽取_第3张图片

4.2Kettle数据抽取——XML文件的数据抽取_第4张图片

预览数据

4.2Kettle数据抽取——XML文件的数据抽取_第5张图片

3.配置“表输出”控件

提示:数据库中的目标表需要提前创建(这里不再赘述创建过程)

连接数据库

4.2Kettle数据抽取——XML文件的数据抽取_第6张图片

4.2Kettle数据抽取——XML文件的数据抽取_第7张图片

4.2Kettle数据抽取——XML文件的数据抽取_第8张图片

 4.运行转换xml_extract,并查看数据表xml表(选择自己顺手的软件即可)

4.2Kettle数据抽取——XML文件的数据抽取_第9张图片

4.2Kettle数据抽取——XML文件的数据抽取_第10张图片

成功!

你可能感兴趣的:(xml,java,开发语言)