Hadoop的Python框架指南

Hadoop的Python框架指南 - 技术翻译 - 开源中国社区
https://www.oschina.net/translate/a-guide-to-python-frameworks-for-hadoop

最近,我加入了Cloudera,在这之前,我在计算生物学/基因组学上已经工作了差不多10年。我的分析工作主要是利用Python语言和它很棒的科学计算栈来进行的。但Apache Hadoop的生态系统大部分都是用Java来实现的,也是为Java准备的,这让我很恼火。所以,我的头等大事变成了寻找一些Python可以用的Hadoop框架。

在这篇文章里,我会把我个人对这些框架的一些无关科学的看法写下来,这些框架包括:
Hadoop流
mrjob
dumbo
hadoopy
pydoop
其它

你可能感兴趣的:(Hadoop的Python框架指南)