spoon下载安装地址:http://www.pentaho.com/download

选择  Download Windows ,只有windows 版的才是spoon,下载解压后即可使用,无需安装。

spoon是纯java编写的,所以使用前必需安装java的jdk包

下载地址:http://www.oracle.com/technetwork/java/javase/downloads/index.html

连接HBase需要配置(实际连接HBase是通过zookeeper服务)

进入spoon解压目录,打开 plugins\pentaho-big-data-plugin\plugin.properties 文件

kettle spoon连接hbase_第1张图片

修改  active.hadoop.configuration 配置项(配置驱动集目录名),默认这里为空。当前已经修改好。

进入目录 plugins\pentaho-big-data-plugin\hadoop-configurations 查看当前可用驱动集目录

kettle spoon连接hbase_第2张图片

里面的4个目录均为 hadoop-configurations 驱动集,链接HBase 需要 zookeeper-*.jar 文件

如在cdh52目录 lib 下:

kettle spoon连接hbase_第3张图片

那么 cdh52 就驱动集可以使用。



HBase启动时会绑定服务器的hostname值,所以在spoon机器中需要绑定相同的host否则无法连接。

在HBase机器上输入命令:

hostname

如:

root@ubuntu:~# hostname
ubuntu

然后修改spoon机器上的hosts

打开 C:\Windows\System32\drivers\etc\hosts 文件

如HBase服务器的IP是 192.168.0.10

则在 hosts 文件中新加一行,并保存。

192.168.0.10 ubuntu


打开spoon,进入spoon解压目录双击 Spoon.bat 文件

注:其实在linux下也可以运行(远程连接不行)只要打开spoon.sh脚本即可

新建转换,并且点击 Big Data > HBase Input

kettle spoon连接hbase_第4张图片


双击 HBase Input 图标 >  点击New 弹出编辑 Hadoop cluster窗口

kettle spoon连接hbase_第5张图片

修改Cluster Name 值(即这个HBase 连接别名),修改ZooKeeper 如HBase所在服务器IP为192.168.0.10 默认HBase 端口号为 2182

kettle spoon连接hbase_第6张图片

确定,然后在 Hadoop Cluster 选中 hbase-test

kettle spoon连接hbase_第7张图片


进入Create/Edit mappings选择卡,按以下步骤操作

kettle spoon连接hbase_第8张图片

然后返回 Configure query 选项卡,按步骤操作

kettle spoon连接hbase_第9张图片


然后鼠标右键HBase Input > 选择Preview  > 快速启动

即可查看数据。