SeaweedFS:简单,高可用的分布式文件存储

最近在调研文件的分布式存储及高可用,在GITHUB上面,发现了这个SeaweedFS项目不错。

SeaweedFS是基于go语言开发的高可用文件存储系统,两大特性

1 成存储上亿的文件(最终受制于你的硬盘大小)

2 速度刚刚的

Seaweedfs的设计原理是基于 Facebook 的一篇图片存储系统的论文Facebook-Haystack

虽然我还没有看,不过我觉得。肯定是NBHH的。今天就只说一下环境相关的。


安装:

第一步,GO的运行环境(还可以参考官网的https://golang.org/doc/install)

wget https://storage.googleapis.com/golang/go1.6.1.linux-amd64.tar.gz

sudo tar -C /usr/local -xzf go1.6.1.linux-amd64.tar.gz

第二步,配置环境变量 /etc/profile

export PATH=$PATH:/usr/local/go/bin

e xport GOPATH=/usr/webserver/go/

export PATH=$PATH:$GOPATH/bin

第三步 安装git

sudo apt-get install git

第四步 安装mercurial

apt-get install mercurial

第五步,编译安装

go get github.com/chrislusf/seaweedfs/go/weed  ((此处需要vpn))

生活在天朝,没有VPN,可以直接下载它的运行包,直接解压,就可以运行了(我就是这样做的,如果这样,etc/profile里面的gopath这一项就不需要了)

export PATH=$PATH:/usr/local/go/bin

export PATH=$PATH:$GOPATH/bin

sudo wget  https://bintray.com/artifact/download/chrislusf/seaweedfs/weed_0.70beta_linux_amd64.tar.gz

(https://dl.bintray.com/chrislusf/seaweedfs/weed_0.70beta_linux_amd64.tar.gz)

tar zxvf weed_0.70beta_linux_amd64.tar.gz


服务启动:

1 进入weed的解压目录,我的是这样的。

root@ubuntu:~/webserver/weed_0.70beta_linux_amd64# ./weed master


注意看,它是启动了一个服务,端口是9333,这是它的默认端口。

2 启动文件存储服务

root@ubuntu:~/webserver/weed_0.70beta_linux_amd64# ./weed volume -dir="/root/webserver/weed_0.70beta_linux_amd64/data" -max=5 -mserver="localhost:9333" -port=9080 &

3 提交一个存储请求,这个时候weed先要分配一个全局的文件ID

curl -X POST http://localhost:9333/dir/assign

4 存储一张图片

curl -X PUT -F file=@/root/webserver/weed_0.70beta_linux_amd64/error.jpg http://127.0.0.1:9080/5,019d90e98a

5 访问测试

因为我的服务器地址是192.168.1.47,http://192.168.1.47:9080/5,019d90e98a.jpg


SeaweedFS:简单,高可用的分布式文件存储_第1张图片

甚至,你还可以加上尺寸,动态获取相应图片的大小


SeaweedFS:简单,高可用的分布式文件存储_第2张图片

确实不错。看了以上的截图,你会发现它的文件ID,至始至终都存在。这就是文件的唯一标识。其实这个ID是每3部分存在的。

其中"fid":"5,019d90e98a"就是 Fid,Fid 由三个部分组成 【VolumeId, NeedleId, Cookie】 组成。

VolumeId: 1          32bit      存储的物理卷的Id

NeedleId: 01        64bit      全局唯一NeedleId,每个存储的文件都不一样(除了互为备份的)。

Cookie: 9d90e98a    32bit      Cookie值,为了安全起见,防止恶意攻击。

以上这些,只能说是用过curl的方式,作为JAVA开发人员。还是需要封装一个这些API,方便访问。

weed java client这是一个老外写的,虽然代码老了点,不过还是很不错。准备看看,拿过来用一下。

网上看了若干的文章

http://blogread.cn/it/article/7721

http://www.sqshi.com/a/270607.html(Bilibili的毛剑是参考了weed而写的BFS)

不过,我觉得,要真正理解这个weed,还是看它的GITHUB官网吧。

SeaweekFS:seaweedfs

你可能感兴趣的:(SeaweedFS:简单,高可用的分布式文件存储)