图1
说明:图2
图3
图4
. “用户名”和“密码”项在各自子服务器的/home/grid/data-integration/pwd/kettle.pwd文件中定义,如图5所示。图5
图6
说明:图7
. 集群模式中加入了上一步建立的一主两从Carte子服务器。图8
说明:图9
. 在弹出窗口中选择上一步建立的集群模式“cluster”后,点击确定,如图10所示。图10
此时会看到“Table output”步骤的右上角出现“Cx2”标志,如图8的红框中所示,说明此步骤在集群的两个子服务器上运行。cd /home/grid/data-integration/ ./carte.sh 192.168.56.104 8181(2)在192.168.56.102上执行下面的命令启动slave1。
cd /home/grid/data-integration/ ./carte.sh 192.168.56.102 8181(3)在192.168.56.103上执行下面的命令启动slave2。
cd /home/grid/data-integration/ ./carte.sh 192.168.56.103 8181(4)保存并执行转换,如图11所示,选择“集群方式执行”,勾选“提交转换”、“准备执行”、“开始执行”三项,然后点击“启动”执行转换。
图11
(5)右键点击“cluster”,选择弹出菜单中的“Monitor all slave servers”,如图12所示。图12
(6)转换成功执行后,会在监控标签中看到执行信息,如图13到15所示。图13
图14
图15
从图13可以看到,“Table input”步骤在master运行,从hive表读取36616行记录,向“Table output”步骤输出36616行记录。图16
图17
说明:图18
. 与配置静态集群不同,这里只加入了master。图19
说明:图20
此时会看到“Table output”步骤的右上角出现“CxN”标志,如图19的红框中所示,说明此步骤在集群的两个子服务器上运行。<slave_config> <slaveserver> <name>master</name> <hostname>192.168.56.104</hostname> <port>8181</port> <username>cluster</username> <password>mypassword</password> <master>Y</master> </slaveserver> </slave_config>(2)在192.168.56.102上编辑/home/grid/data-integration/pwd/carte-config-8181.xml文件,内容如下:
<slave_config> <masters> <slaveserver> <name>master</name> <hostname>192.168.56.104</hostname> <port>8181</port> <username>cluster</username> <password>mypassword</password> <master>Y</master> </slaveserver> </masters> <report_to_masters>Y</report_to_masters> <slaveserver> <name>slave1</name> <hostname>192.168.56.102</hostname> <port>8181</port> <username>cluster</username> <password>mypassword</password> <master>N</master> </slaveserver> </slave_config>(3)在192.168.56.103上编辑/home/grid/data-integration/pwd/carte-config-8181.xml文件,内容如下:
<slave_config> <masters> <slaveserver> <name>master</name> <hostname>192.168.56.104</hostname> <port>8181</port> <username>cluster</username> <password>mypassword</password> <master>Y</master> </slaveserver> </masters> <report_to_masters>Y</report_to_masters> <slaveserver> <name>slave2</name> <hostname>192.168.56.103</hostname> <port>8181</port> <username>cluster</username> <password>mypassword</password> <master>N</master> </slaveserver> </slave_config>(4)执行下面的命令启动master。
cd /home/grid/data-integration/ ./carte.sh pwd/carte-config-8181.xmlmaster启动之后,启动slave。
cd /home/grid/data-integration/ ./carte.sh pwd/carte-config-8181.xml(6)在192.168.56.103上执行下面的命令启动slave2。
cd /home/grid/data-integration/ ./carte.sh pwd/carte-config-8181.xml(7)保存并执行转换,如图21所示,选择“集群方式执行”,勾选“提交转换”、“准备执行”、“开始执行”三项,然后点击“启动”执行转换。
图21
(5)右键点击“cluster”,选择弹出菜单中的“Monitor all slave servers”,如图12所示。图22
图23
图24
从图23可以看到,“Table input”步骤在master运行,从hive表读取36616行记录,向“Table output”步骤输出36616行记录。