Google真正的竞争力是什么

 是搜索引擎? 是Gmail, Gmap, G-whatever? 当然,Google是靠搜索引擎起家的。它在这方面的品牌优势是目前谁也比不了的。但这真的是Google的优势么?为什么一个百度在中国就能比它更受欢迎呢? 老实说, 做网站谁不会啊, 尤其是放个文本框, 敲进去什么马上就能再回来一页,谁都会学。后台的技术也不见得有多深奥,所以百度能够提供和Google一样的服务和速度。

  那么Google的竞争力到底在哪里呢? Google在北美已经买了一个遍布美国的光纤骨干网, Google的视频服务也正在测试之中,Google到底想干什么呢?Google的核心到底是什么呢,它超越于一般网站的地方到底在何处?

  一家之言,我觉得答案就是Cluster, Google自己的Cluster。Cluster可以翻译成集群式计算机。它是由多个PC组成的分布式的计算机系统。这些PC的所有的内存构成了这个分布式计算机的内存。所有的硬盘构成了找个分布式计算机的存储空间。把这些廉价PC机集合在一起, 让它们有机的工作, 在外面看来就象一台超级计算机Cluster的关键技术就是Cluster的软件。而Google正是在Cluster的软件技术方面无人能及。

  让十台,二十台甚至一百台PC机协同工作已经不是什么难的技术了,国内也有研究所在做这方面的工作。Cluster的软件最关键的指标就是可扩展性(Scalability), 五百台在一起能不能正常工作,一千台呢, 两千台呢?这其中涉及到的如何利用分布式的CPU, 内存和硬盘资源, 学问可就大了。Google使用基于Linux的Cluster已经不是秘密了。外接对Google Cluster到底有多大一直有所猜测,但Goolge从来不公布它有关自己Cluster 的信息。Google的新闻发言人在被问及此事的时候,只是大概的说Google的Cluster大概有一万个节点。也就是说由一万台PC组成的分布式计算系统。这已经是一个很惊人的数字了。 更重要的是, 超大规模计算机是非常昂贵的产品,而基于Linux的Cluster的出现是超级计算机的性价比大大降低了。有了强有力的Cluster软件,只需把能找到的PC往上堆就行了。

  然而有人根据Google发布的一些关于它系统的数字进行分析,发现Google 很有可能在隐瞒它的Cluster的真正大小。 真正的Google Cluster的大小,可能在十万个节点左右,而且还在增加之中!这是一个非常惊人的数字,能够让这么多节点协同工作,对Cluster软件的要求非常的高。这个系统就像一个超大规模的蚁穴一样,所有的节点都在分工合作。这个系统是永远也不会down机的,在任意一个给定的时刻,肯定会有一定数量的PC机是损坏的,但它们能够被及时的更换。你见到过Google的主页有down机的时候么, 速度慢的时候也很少, 这是全世界几亿使用者的共同经验!

  有了这样一个超大规模的计算机系统,超大规模的计算能力,超大规模的存储系统,是可以做很多事情的。 注意到Gmail 的空间一直在增加了么?这证明了Goolge对于海量内存的管理能力在不断增加(只不过是不断往上摞PC罢了:))。 有这样一个超大规模的分布式系统,节点分布在全国各地,这个系统对于互联网内容的输送能力就显而易见了。那么还缺什么呢, 当然是一个可以覆盖全国的IP骨干网。这也就是为什么Google, 一个网站公司, 要买一个遍布美国的光纤骨干网的原因。

  制造超过上万节点的分布式计算机系统,全世界只有两家公司掌握了这个技术, 一个是Google, 一个是Akamai, Akamai是做Content Delivery的, 也就是把网站的内容更快的送到用户的手中,Akamai使用它的分布式计算机系统来为网站发布内容, AOL, CNN等都是它的客户。Google正在全美高速兴建它的数据中心,现在已经有了40到50个,未来会发展到上百个,而这些数据中心也是它超大规模分布式系统的一部分。

  这个庞大的Cluster并没有一个中央处理器,在地理位置上也是遍及全美各地Google的数据中心,每个节点都是这个系统的一部分,一台廉价的PC机,在安装了cluster软件后,立即融入到这个系统之中。掌握了建立以廉价PC为节点的超大规模Cluster 的构造技术,这才是Google 真正的竞争力。。。

你可能感兴趣的:(工作,Google,分布式计算,数据中心,Scalability,akamai)