Gmail架构相关资料收集

Want to know how Gmail works - and whether it will work?

想知道Gmail是怎么工作的吗?未来的它会如何发展?

简要描述:

            Gmail限制每个免费用户只拥有1GB(注:现在是15GB了)的邮箱容量,算上冗余和索引,每百万用户需要2.5PB的存储。

            然而,实际上并不需要这么多:Gmail采用邮附分离的形式,邮件内容进入搜索引擎,以谷歌索引网页的形式来进行索引;附件进入一个专门的附件存储系统,当多封邮件有相同附件时只保存单副本,进一步缩小存储使用量。其次,Gmail的反垃圾系统也相当强大,而且正在不断的完善过程中,用户可以看到自己收件箱中的垃圾邮件显著减少,而过滤垃圾邮件过程中采集到的有用的数据又会自动反馈给反垃圾团队进行进一步的分析优化。

             经过以上处理,每百万用户只需要0.25PB的存储而非2.5PB。用户购买邮箱空间所支付的钱为gmail带来营收,平均一个用户在这上面一年产生1~10美金的支付。


你可能感兴趣的:(搜索引擎)