mr与spark的比较

  1. mr目前不支持DAG计算模型,Tez尝试做这样的优化,但还不成熟。

  2. spark 1.2.0之前的版本,shuffle有问题,不够稳定,1.2.0使用了netty4,据称解决了问题,还没有进行尝试。

  3. spark生态圈更具优势,spark sql、spark streaming、spark graphx、spark mllib都基于spark core,之间可以无缝串联。

  4. spark更方便,spark-shell可以很快地进行一些原型验算。

  5. hadoop更heavy也更稳定。

你可能感兴趣的:(mr与spark的比较)