【每周推荐阅读】ZFS:现代海量存储系统的开山之作

现在我们互联网公司所研发的存储系统都需要面向或者立足在海量数据存储之上,这个海量往往定义在PB级。然后,在NoSQL未兴起的上个十年,人们对“海量数据”往往只局限在SQL系统所界定的百TB级别内。在我早期的博客中也提到,NoSQL的兴起主要在“可扩展性”和规模上,随着数据量不断的膨胀,数据规模越来越大,需要系统能够动态扩容和扩展存储规模;当然随着规模的不断扩大,在容错/调度/一致性/性能和吞吐上就暴露出很多问题。而“扩展性”以及引发的问题,最早引起关注的是Sun所开发的Zettabyte File System(ZFS)。

 

在我还是PHD candidate从事分布式存储方向研究的时候,ZFS就作为典型的文件系统被要求了解。尽管ZFS后来随着Sun公司被收购以及Google为代表互联网公司系统的光芒覆盖,但动态扩容的系统架构、以及诸如资源池、COW、智能预取、快照/克隆等技术都成为后续分布式文件系统研发的基础技术和功能要点,有些甚至已经进入Linux的标准发行主干。本周推荐阅读的是2003年发表在FAST的Zettabyte File System(ZFS)的paper,希望能让大家能从中有一个全局的了解技术的来龙去脉,当然现在ZFS已经变成OpenZFS,变种版本在开源上也能找到。

你可能感兴趣的:(系统)