【每周推荐阅读】SEDA:高并发系统设计模型与架构

布式文件系统最复杂的设计莫过于master节点,其制约了整个系统的性能和存储容量。无论是GFS、Tencent XFS,还是后来Baidu的Nearline、乃至当今的AFS设计,都采用了两级的设计架构:namespace和meta info分离的方式来解决系统可扩展性问题,以更好适应万台规模的系统应用。然后,采用这样的两级架构也使得文件元数据更新变得复杂,特别在数据一致性与性能之间寻求最佳平衡点的问题上。

 

Google的GFS在这种架构上走在最前列,Tencent XFS延续了GFS设计的许多经验和成功积累。从2011年开始我参与的XFS项目是由来自Google inf的huican和hans两位大牛所领导的。整个XFS的master沿用了GFS所采用的“triple-tree”实现思想(即read-only tree, mutation tree, checkpoint),将对meta tree的操作进行了细粒度的分离,读、更新、checkpoint操作全部分离,从而实现了在强一致以及高鲁棒下的高性能要求,当时的UPS(updates per second)接近2W。在随后大半年的应用中都没有太多的升级和修改(部分原因hans调任其他组组长),因为对namespace的操作而言,这样的设计已经接近于完美。直到2012年,在一次profiling中发现namespace与meta info之间的数据控制流存在阶段性依赖(例如2PC部分),并尝试采用SEDA去改造才实现了再次的性能突破,最终将UPS提升到6W。

 

SEDA(Staged Event-Driven Architecture)是一种以状态事件驱动为基础的高并发模型。在2012年在XFS中参照SEDA模型将master改造成并行流水线方式处理,从而提高整个master的吞吐。本周推荐阅读的是发表在2006年SOSP上的SEDA: An Architecture for Highly Concurrent Server Applications

你可能感兴趣的:(seda)