分布式文件系统KFS源码编译与安装过程

Kosmos distributed file system (KFS)是一个专门为数据密集型应用(搜索引擎,数据挖掘等)而设计的存储系统,类似于Google的GFS和Hadoop的HDFS分布式文件系统。 KFS使用C++实现,支持的客户端包括C++,Java和Python。

以前曾在开源KFS基础上做过开发,这里介绍一下如何进行KFS的源码编译与安装过程(以kfs-0.5为例)。

1.安装依赖软件

为了编译和运行KFS文件系统,需要安装以下软件包:

  • Boost (1.34或以上)
  • cmake (2.4.6或以上)
  • log4cpp (1.0或以上)
  • gcc version (4.1或以上)
  • xfs devel RPMs on Linux

下面介绍的是手动安装以上软件包的过程,这里假设你已经下载完成软件包压缩文件。

1、安装gcc

1 tar zxvf gcc-4.1.2.tar.gz
2 mkdir/usr/local/gcc-4.1.2
3 cd gcc-4.1.2
4 ./configure --prefix=/usr/local/gcc-4.1.2 --enable-threads=posix --disable-checking --enable--long-long --host=i386-redhat-linux--with-system-zlib --enable-languages=c,c++,java
5 make
6 make install

备注:以上过程将gcc安装在/usr/local/gcc-4.1.2目录下,支持C/C++和JAVA语言,其它选项参见gcc提供的帮助说明。

2、安装log4cpp

1 tar xvzf log4cpp-1.0.tar.gz
2 cd log4cpp-1.0
3 ./configure
4 make
5 make install

3、安装xfs

1 tar xvzf xfsprogs-3.0.1.tar.gz
2 cd xfsprogs-3.0.1
3 ./configure
4 make
5 make install
6 make install-dev

4、安装cmake

1 tar xvzf cmake-2.6.4.tar.gz
2 cd cmake-2.6.4
3 ./bootstrap
4 make
5 make install

5、安装boost

1 tar xvzf boost_1_39_0.tar.gz
2 cd boost_1_39_0
3 ./bootstrap.sh
4 ./bjam -sTOOLS=gcc --without-python install

2.编译和安装KFS

首先,到sourceforge下载kfs-0.5.tar.gz(点击下载),这里假设下载后目录为用户根目录。

然后,解压KFS软件包,这里假设解压后KFS所在目录:~/kfs-0.5,编译源码所在目录:~/kfs-0.5/build。

为了完整编译KFS,需要有以下三部分:

  • 编译C++部分,生成MetaServer/ChunkServer,各种API操作的tools,C++客户端;
  • 编译Java部分,生成kfs.jar,即Java客户端,以通过Java JNI调用本地的C++方法;
  • 编译Python扩展模块,生成Python客户端。

2.1 编译C++部分

1 tar xvzf kfs-0.5.tar.gz
2 cd kfs-0.5
3 mkdir build
4 cd build
5 cmake -D CMAKE_BUILD_TYPE=RelWithDebInfo ~/kfs-0.5
6 gmake
7 gmake install

编译之后,二进制文件将被安装在以下目录:

  • 可执行文件:~/kfs-0.5/build/bin
  • 库文件:~/kfs-0.5/build/lib

备注:编译KFS过程中,带上了debug调试信息。

2.2 编译Java部分

1 cd ~/kfs-0.5
2 ant jar

编译之后,生成的文件为:

  • Java class文件:~/kfs-0.5/build/classes
  • Java Jar包:~/kfs-0.5/build/kfs-0.5.jar

最后,将生成的Jar包添加到CLASSPATH环境变量中:

1 export CLASSPATH=${CLASSPATH}:~/kfs-0.5/build/kfs-0.5.jar

2.3 编译Python扩展模块

为了编译Python扩展模块,首先需要进行步骤2.1,生成KFS客户端库文件,这里库文件所在目录是:~/kfs-0.5/。

编译Python扩展模块的步骤:

1 cd to ~/kfs-0.5/src/cc/access
2 Edit kfs_setup.py and setup the include path. Specifically, kfsext = Extension('kfs', include_dirs ['kfs/src/cc/', '<path to boost>'])
3 python kfs_setup.py ~/kfs-0.5/build/lib/ build

编译之后,生成共享链接库kfs.so,进行安装:

1 python kfs_setup.py ~/kfs-0.5/build/lib/ install

如果要安装到一个指定的目录下(如~/kfs-0.5/build/lib),需要设置home选项:

1 python kfs_setup.py ~/kfs-0.5/build/lib install --home=~/kfs-0.5/build/lib

同时,需要更新PYTHONPATH和LD_LIBRARY_PATH环境变量:

1 export PYTHONPATH=${PYTHONPATH}:~/kfs-0.5/build/lib/lib64/python
2 export LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:~/kfs-0.5/build/lib

3.启动KFS服务进程

1、 MetaServer

1 cd ~/kfs-0.5/build/src/cc/meta
2 cp ~/kfs-0.5/conf/MetaServer.prp ./
3 ./metaserver MetaServer.prp

备注:这里需要提前创建MetaServer.prp中指定的和logDir和cpDir目录:./kfslog和./kfscp。

2、ChunkServer

1 cd~/kfs-0.5/build/src/cc/chunk
2 cp ~/kfs-0.5/conf/ChunkServer.prp ./
3 ./chunkserver ChunkServer.prp

3、KfsClient

1 cd ~/kfs-0.5/build/src/cc/tools
2 ./kfsshell –s <meta server name> -p <port>
3 ./cptokfs –s <meta server name> -p <port> -d <source path> -k <kfs path>
4 ./cpfromkfs –s <meta server name> -p <port> -d <source path> -k <kfs path>

备注:~/kfs-0.5/build/src/cc/tools目录下有各种API操作工具,如kfsshell、cptokfs、cpfromkfs等,这里没有一一列举。

4.查看和关闭KFS服务进程

1、查看进程

1 ps –aux | grep metaserver
2 ps –aux | grep chunkserver
3 ps –aux | grep kfsshell

2、关闭进程

1 kill -9<pid>

5.参考资料

  • http://code.google.com/p/kosmosfs/
  • http://sourceforge.net/projects/kosmosfs/

你可能感兴趣的:(分布式文件系统)