大数据开源项目集锦(持续更新)

(1)Hadoop 一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序

  http://hadoop.apache.org/

 

(2)Marathon是一个全新的框架,它将Mesos变成一个更有活力的工具,进而可以在单一的集群上运行不同的应用程序。

  https://github.com/mesosphere/marathon

 

(3)Twitter开源了名为Summingbird的数据分析工具。区别于以往的更快、更准确节奏,Summingbird更注重于流处理与批处理的无缝整合,以及编程语言的原生化。

  https://github.com/twitter/summingbird/wiki#future-plans

你可能感兴趣的:(hadoop,大数据,分布式,开源项目,批处理)