用微服务器处理海量数据——你敢尝试吗?

近日,提供在线网上聊天服务的eHarmony公司采购了一批内置Intel Atom处理器的SeaMicro服务器,用它们来运行基于Hadoop结构分布式计算服务。

如果是在几年前,eHarmony在服务器上采用Atom处理器的行为无异于自杀,毕竟Atom的性能实在有限,况且业界也并没有一个完整的微处理器解决方案。但是现在SeaMicro和Calxeda(主要采用ARM处理器的微服务器)厂商所开发的服务器,已经能够大大降低建造成本,并能节省能源。

不过业界普遍认为,如何满足应用程序和大客户的需要是这些微服务器普及之前首先需要解决的问题。而对于大数据处理来说,类似Atom这样的处理器则需要将以上两个问题都解决——

Calxeda:采用ARM原因在于没有历史负担

虽然Calxeda公司所生产的ARM架构微型服务器在处理器结构上与SeaMicro公司的X86架构微型服务器存在很大不同,但Evans所总结的前两个优势同样适用于SeaMicro的X86架构产品。

用微服务器处理海量数据——你敢尝试吗?_第1张图片

Calxeda公司CEO Barry Evans表示,“对于海量数据来说,有三个关键因素说明ARM架构服务器将是非常适合的。首先,海量数据的处理本身就具有向外扩展的特性,需要众多高效处理器来进行处理。其次,海量数据处理作为一个新兴的市场,其所要面对的历史遗留问题很少。最后,目前针对这一领域的软件对ARM架构的支持程度很好。

Hadoop on microservers

Hadoop作为一种分布式计算结构,对于很多公司和组织来讲都是一个全新的领域,而他们大多没有专门应对这一应用的硬件。分布式计算需要众多的scale out扩展结构来提升整个系统的并行处理能力。而对于分布式计算的每个节点,Hadoop并不要求其性能能够与高功耗、高性能的专用处理器相媲美,相反,其对性能的要求是非常低的。而微型服务器则能够凭借众多的物力核心和相对较小的体积来很好的满足Hadoop计算的需求。

用微服务器处理海量数据——你敢尝试吗?_第2张图片

Atom节点最低功耗仅5瓦

SeaMicro的微型服务器可以在10U机架的体积内提供512个Intel Atom核心并产生1.28TB/s的计算能力,而相对于传统服务器来说,其能耗却降低了75%。而Calxeda公司的微型服务器产品则可以在2U的体积内提供120个4核心ARM Cortex A9架构处理器,而每个处理器节点的功耗只有5瓦。知名记者Stacey Higginbotham在谈论Calxeda计划时表示,“Intel和AMD基于x86架构的四核心处理器功耗在80至130瓦之间,节能版本的x86芯片也有30瓦的功耗。对于坚持使用传统服务器芯片的用户可考虑Dell公司销售的cloudscale微服务器,它采用Intel Xeon处理器,功耗为30瓦。

用微服务器处理海量数据——你敢尝试吗?_第3张图片

Evans的理论和eHarmony公司的实例都证明,微型服务器对于Hadoop这种大数据计算来说却是非常合适。而在使用微型服务器之前,eHarmony公司也曾使用云服务来满足其需要,不过他们发现,当他们进行大量并行计算并与云服务其交换大量数据时,这一方法就会变得非常昂贵。而作为一家之前没有任何服务器硬件投资的公司来说,eHarmony公司可以很轻易的转投至微型服务器架构中。Data Center Knowledge的Rich Miller也表示“微型服务器可以为CTO每月减少数万美元的运营费用,使成本降低74%。”

由于在eHarmony案例上的成功,我们可能很快就会看到像SeaMicro和Calxeda这样的公司与Cloudera(目前最大的分布式计算软件提供商)达成OEM协议。当然,随着微型服务器在这一领域的迎头赶上,我们也很有可能看到软硬件一体化解决方案的提供商。

微服务器的未来

可以看到,微服务器的倡导者之所以如此乐观,主要是受到了近年来互联网和云计算市场蓬勃发展的影响。像Facebook的技术主管就表示,该公司并不准备融入 服务器虚拟化的潮流,而是希望将微服务器作为一种廉价增长和快速故障转移方式。目前,Facebook已经测试了微服务器,并且有意将其用于大规模的数据 中心。

有数据显示,Facebook在2010年6月时,其服务器数量超过了6万台,而2008年4月为1万台,即使到了2009年底也才是3万多台。而等今年俄勒冈数据中心开放后,Facebook的服务器数量将接近10万台。

Facebook或许是一个特殊的例子,但它确实代表了高速发展的新兴互联网企业的一种趋势。未来,当新兴互联网业务和云计算需求彻底被唤醒的时候,或许才是微服务器真正的春天。

最新的消息是,在未来的几天内,包括美国麻省理工学院著名教授Anant Agarwal, 同时也是Tilera公司的创始人和CTO。以及惠普实验室的Partha Ranganathan将开始深入讨论新一代的分布式体系结构,而此次会议的目的也主要在于探讨将将大量低功耗处理器压缩为小规模处理器的概念,以获得在外部具有海量数据的应用程序(主要是网络应用)。

你可能感兴趣的:(hadoop,互联网,服务器,网络应用,分布式计算,Facebook)