kettle实现hadoop文件操作

Kettle默认版本只支持0.20.0的版本

如果要支持,2.2版本,要进行插件升级

1.1复制文件到hadoop系统

场景描述:从本地环境(window)复制txt文件到10.204.104.193的hadoop环境,放到/user/hadoop/input目录下

1.1.1 环境及元数据描述

2013-11-14

Kettel版本信息:pdi-ce-4.4.0-stable

C:\weblogs_rebuild  存放txt文件

Source: file:///C:/weblogs_rebuild

Target: hdfs://hadoop:[email protected]/user/hadoop/input

文件:^.*\.txt

1.1.2 步骤

n  新建job1

n  拖放”开始”控件及“Hadoop CopyFiles”控件到操作区

n  连线

如图:

kettle实现hadoop文件操作_第1张图片

n  编辑“Hadoop Copy Files”

 kettle实现hadoop文件操作_第2张图片

kettle实现hadoop文件操作_第3张图片

n  保存、执行

你可能感兴趣的:(Kettle,hadoop)