1.3 Kettle从web抽取数据

一. 基于文本文件的web客户端抽取

    由于kettle使用了Apache VFS系统,VFS系统可以像处理文本文件一样处理http文件,所以在‘文本文件输入’步骤中可以直接将URL作为文件名:

1.3 Kettle从web抽取数据_第1张图片

二. HTTP客户端

使用HTTP client 步骤,它调用URL并返回一个字符串作为结果。返回的字符串是用分隔符分割的文本文件或是XML格式的字符串,可以使用XML输入步骤进一步处理。

1.3 Kettle从web抽取数据_第2张图片

将URL填入生成记录中:

1.3 Kettle从web抽取数据_第3张图片

填写http客户端步骤:

1.3 Kettle从web抽取数据_第4张图片

这时候可以预览结果:

1.3 Kettle从web抽取数据_第5张图片

三. SOAP

    soap是(simple Object Access Protocol)的缩写。具体以后会写一篇博客专门讲。

你可能感兴趣的:(Kettle,ETL)