GFS(Google 文件系统)的简略理解及自己的看法

GFS是google的一个带有可拓展的新式分布式文件系统,既然是可拓展,顾名思义可用于大量数据,大型数据或者分布式的一个访问系统。当然,也更高效,不然也不会有它的存在在这里。

缘由

或许都知道Google的分布式文件系统,因为没有任何的东西的完美的,最初的分布式文件系统存在着诸多问题,最初的目的是处理众多大数据。
1.大型文件的应用,以至于其大型数据处理能力较好,但对小型数据或文件的识别和处理则并不出色。
2.早期的系统一旦无法识别或正常使用,服务器等组件的缺失损坏都是部件异常等。
3.早期系统文件采用覆盖式的更新,速度极度缓慢,效率低下,无法大面积覆盖。
4.其次则是大家都在说的效率第,交互缓慢且不稳定。
由于时代的变迁,需求越来越广泛,普通的交互文件系统已经不能满足新时代数据化时代的高效处理能力,因此新一代的GFS则走向了我们的视线。

优势

 监控与自查:因为价格因素,系统采用的是普遍较为廉价的组件进行服务,所以故障,异常都是很常见的情况,所以GFS具有能够持续监视自身的状况,找到并尝试修复失效或故障的组件。
高效及稳定:高效是当代社会都在追求的一个东西,GFS采用单个master节点,多台chunk服务器,并且可同时被多个客户端访问,在旧系统的基础上极大的提高了读写及传输速率,同时采用元数据的日志处理降低了系统崩溃造成损失的风险。
同时使用记录追加和快照提高对数据文件的更新和存贮能力。

应用

GFS的应用极其广泛所以就自己专业而言
机械设计极其自动化,说到此则是一大堆数据,实验数据,测量数据,结果,需要对其进行整理储存以便后时之用,也需要查阅大量资料文献来验证。
就单一实验而言,需要大量数据进行排误和验证推理,因为目前是以机器及计算机做大量实验来确定最终结果,就需要高效的处理能力,GFS所能提供的文件数据处理能力是对此的极大助力,其次,其覆盖面广,简单易搭建也是首选之举,更何况是大量测试研究改进。
而后,处理是一方面,因为数据需要实时更新,则需要其能长期不间断对数据进行处理,并且可以较为稳定的储存所需的实验及设计实际使用数据,对后期的改进有着极大的帮助。
因此,GFS对本专业而言有利大多于弊。但是,GFS不仅仅局限于此,它所能作的极大范围
只要是涉及大数据的交互,它都有参与的余地。

     参考文献【Google File System 中文版】.

你可能感兴趣的:(GFS(Google 文件系统)的简略理解及自己的看法)