http://blog.sina.com.cn/s/blog_6b98772b0100pk7p.html
Swift是一个存多份,可扩展的分布式对象存储系统。可扩展到PB级。没有主控节点。支持REST接口。提供类似S3的云存储服务。
Swift的同类产品,这个没把握,不知到luster,ceph算不算。
bin/目录下,工具代码:5685 total
swift/目录下,核心代码: 15880 total
test/目录下,测试代码: 23127 total
上述代码使用Python编写。
Swift主要有Rackspace开发,现在有Cloudscaling和Intermap也使用了Swift。
Here are some good use cases for Openstack Object Storage:
StoRing media libraries (photos, music, videos, etc.)
Archiving video surveillance files
Archiving phone call audio recordings
Archiving compressed log files
Archiving backups (<5GB each object)
StoRing and loading of OS Images, etc.
StoRing file populations that grow continuously on a practically infinite basis.
StoRing small files (<50 KB). Openstack Object Storage is great at this.
StoRing billions of files.
StoRing Petabytes (millions of Gigabytes) of data.
当前把使用Swift的公司有Cloudscaling和Intermap 。在中国没有人开始尝试使用Swift。Cloudscaling提供云计算和云存储解决方案,Intermap用来存放立体图片。
Swift使用了Eventlet、Webob、Paste.deploy等库。这些库的引入在对代码阅读,不会造成大的障碍。
Swift的典型架构:
上图中的圆柱体标示为Storage服务。Storage服务节点上面运行的组件是Account Server, ContainerServer, Object Server。这三个服务是独立的,都监听一个特点的端口,使用Http来通讯。认证(Auth)服务和Proxy服务也是监听一个端口,使用Http来通讯。
Zone是一个逻辑上的区域,Zone和Zone之间要尽量做到互不影响的,例如说可以是不同磁盘,不同的服务器,不同的机柜,不同的交换机,甚至在不同的数据中心。
Swift集群内数据的分配、一致性等的核心组件是Ring。Ring的代码并不多,一个build.py和一个ring.py。build.py负责create和reblance功能。对Ring的设计目前知道了它实现的方法,但还不能很明确的理解为什么要这样实现(网上有一个文档剖析了Ring的实现,还没有看)。
Swift的各个组件模块之间有独立性,可以方便对代码进行分析和测试。
上层开发者指的是调用Swift REST接口进行编程的人员。Swift面向开发者提供了一个REST接口文档,可参考这个文档写程序。按照这个文档,我成功写了一个简单的创建、上传和下载的网络应用实例。根据Openstack站点上描述,Swift和Rackspace的云文件存储的接口是兼容的,可以使用Rackspacs提供的经过特定语言封装REST之后的编程接口,这样对程序员会更友好。
Rackspace用Swift已经有多年时间。如过我们使用Swift来提供存储服务。现有的可利用资源有完全开源的代码,规范的代码注释和风格,现有的系统部署和管理文档,Rackspace公布的一些简单的注意事项, 现有的面向开发者的REST接口文档,现有的多种语言封装之后的库。
没有Swift的性能数据,