GFS的系统架构

刘鹏《云计算(第二版)》

 

GFS的系统架构_第1张图片

①~⑤是控制流,⑥是数据流

Client: 应用程序的访问接口

Master(主服务器):管理节点在逻辑上只有一个,保存系统的元数据(Metadata,描述数据的数据),负责整个文件系统的管理。

Chunk Server(数据库服务器):负责具体的存储工作。数据以文件的形式存储在Chunk Server上。

 

架构设计成这样的好处是:

1、Client和Master之间只有控制流(①~⑤),没有数据流,因此降低了Master的负载因为控制流只需传送指令和状态,数据量小

2、Client与Chunk Server之间直接传输数据流,同时由于文件被分成多个chunk进行分布式存储,因此Client可以同时并行访问多个Chunk Server,从而让系统的I/O并行度提高

 

GFS的特点:

1、采用中心服务器模式

好处是:(1)可以方便的增加Chunk Server

    (2)Master可以掌握系统内所有Chunk Server的情况,方便进行负载均衡

    (3)不存在元数据的一致性问题(因为只有一个中心server,所以云数据也只有一份

2、不缓存数据(没有系统cache

好处是:(1)文件操作大部分是流式读写,不存在大量重复的读写,因此即使使用cache对系统性能的提高也不大

    (2)Chunk Server上的数据存储在本地文件系统上(Linux File System),若真的出现频繁存取,那么本地文件系统的cache也可以支持

    (3)若建立系统cache,那么cache中的数据与Chunk Server中的数据的一致性很难保证

 

思考:

GFS采用中心服务器的模式,该模式的最大优点是便于管理,因为中心服务器可以获知所有子服务器的状态,因而可以很方便的得知各个子服务器的负载状况等。但是这一模式也有一个比较致命的缺点,那就是单点故障。当单点故障发生在中心服务器时,将导致整个系统的不可用。

不过,按照上述描述,GFS的中心服务器只是逻辑上是一个,因此可以想象,其实GFS的Manster还是有后备机制的,因此GFS比较像伪集中式管理

转载于:https://www.cnblogs.com/elaron/archive/2012/09/27/2706049.html

你可能感兴趣的:(GFS的系统架构)