Hadoop与Strom

   2011最后一个季度的工作基本上是围绕着两个开源项目展开的,总结如下:
   由于硬件的瓶颈,摩尔定律已无法跟上数据量增长的趋势。分布式系统应运而生,而Hadoop和Storm正好代表了两个分布式系统发展的两个方向。
   分布式系统,其主要问题在于如何在节点上将对应的操作应用到数据上。其计算模型也就变成了如何对数据或者操作或者两者的混合进行分发和处理。Hadoop根据移动计算优于移动数据的原则,将操作分发到存储数据的节点,仅在需要且必须移动数据的时候移动数据。这一点注定了Hadoop的适用范围——批处理计算。因为在我们需要对数据进行一系列操作时,数据已经固定了,从某种意义上来说,数据是死的,移动他们是费力且困难的。而对于流式计算来说,数据是流动的,我们可以预知对这些数据进行什么样的操作,但是并不知道这些数据到底是什么(因为他们是实时传送过来的),故采取了对数据进行分发到存储着固定操作的节点。这就是Storm。

你可能感兴趣的:(hadoop)