T-12-云计算 | Google分布式文件系统GFS

1. GFS 的系统架构

GFS 的系统架构

GFS将系统节点分为三个部分:


GFS 系统节点

2. GFS 的实现机制:

  • 客户端首先访问Master节点,获取交互的Chunk Server信息,然后访问这些Chunk Server,完成数据存取工作。这种设计方法实现了控制流和数据流的分离。
  • Client与Master之间只有控制流,而无数据流,极大地降低了Master的负载。
  • Client与Chunk Server之间直接传输数据流,同时由于文件被分成多个Chunk进行分布式存储,Client可以同时访问多个Chunk Server,从而使得整个系统的I/O高度并行,系统整体性能得到提高。

3. GFS 特点

  1. 采用中心服务器模式
  • 可以方便地增加Chunk Server
  • Master掌握系统内所有Chunk Server的情况,方便进行负载均衡
  • 不存在元数据的一致性问题
  1. 不缓存数据
  • 文件操作大部分是流式读写,不存在大量重复读写,使用Cache对性能提高不大
  • Chunk Server上数据存取使用本地文件系统,从可行性看,Cache与实际数据的一致性维护也极其复杂
  1. 在用户态下实现
  • 利用POSIX编程接口存取数据降低了实现难度,提高通用性
  • POSIX接口提供功能更丰富
  • 用户态下有多种调试工具
  • Master和Chunk Server都以进程方式运行,单个进程不影响整个操作系统
  • GFS和操作系统运行在不同的空间,两者耦合性降低

4. GFS 容错机制

Master 容错

Chunk 容错

5. GFS 系统管理技术

GFS 系统管理技术

你可能感兴趣的:(T-12-云计算 | Google分布式文件系统GFS)