根据网上公开资料整理的Twitter架构,主要是cache方面,加了作者自己的补充,跟实际的架构未必完全一致。

一些数据:

  • Cache分Page cache, fragment cache, row cache, vector Cache, cache命中率见图。
  • Fragment cache存放了API各种请求格式的数据,包括XML, JSON, RSS, ATOM。
  • 发表Tweets是先放入Kestrel, 再异步处理,Kestrel用的也是memcached协议。
  • API requests: 550 r/s。
  • POST tweets: 峰值:平时 80tweets/s, 奥巴马就任时达到 350tweets/s。
  • Aggregator模块需要访问memcached multi get  数百个/s。
  • Ruby on Rails前面还用了Varnish作前端反向代理。

参考资料:

  • QCon London 2009: Upgrading Twitter without service disruptions
  • Improving Running Components at Twitter (PDF slide)