katta的分布式

现在来进行Katta的分布式运行配置,Katta是用来进行分布式索引管理的项目,可以出来大数据量的插入和查询。

我使用的三台机器分别为master,node1,node2,系统都为Centos 5

在下载回来的文件解压后进入conf文件夹,在里面需要改几个文件

masters文件
把localhost改成master(主节点名)

nodes文件
node1
node2(加入你的节点机器的名称)

katta.zk.propeties文件
# comma serperated list of host:port that should run a zookeeper server, # make sure you use hostnames and not ip addresses
zookeeper.servers=<master>:2181  (把localhost改成master)
...

katta-env.sh文件
# Set Katta-specific environment variables here.
...
# The java implementation to use. Required.
export JAVA_HOME=/usr/lib/j2sdk1.5-sun  (JDK目录)
...
# host:path where hadoop code should be rsync'd from. Unset by default.
export KATTA_MASTER=server0:/home/$USER/katta-distribution
...


在三台机器上做同样的部署

启动:bin/start-all.sh
关闭:bin/stop-all.sh

接下来部署索引,让Katta来管理索引
部署索引的格式
bin/katta addIndex <name of index> [file:///<path to index>|hdfs://<server name>/<path to index>] <lucene analyzer class name> <replication level>

如果你有装hadoop集群的话,可以把在hadoop上的索引部署到Katta上,让Katta来管理

查找的格式
bin/katta search <index name>[,<index name>,...] “<query>” [count]

然后当然是列出你要查找的数据咯

你可能感兴趣的:(hadoop,centos,配置管理,项目管理,zk)