Pivotal 开源其大数据套件

Pivotal决定开源其大数据套件和核心组件,并宣布成立ODP(Open Data Platform)组织,ODP旨在倡导和推进大数据领域的开源和标准化。

相比HortonWorks、Cloudera和MapR这些早先的玩家,Pivotal是大数据市场的后来者。但现在,为了解决大数据领域“分裂(fragmentation)和供应商锁定(vendor lock-in)”的问题,Pivotal决定将其大数据套件中的一些产品进行开源。这些产品包括Greenplum Database(并行处理的数据仓库)、HAWQ(和ANSI标准兼容的Hadoop上的SQL查询引擎)和GemFire(分布式内存中的NoSQL数据库)

迈克尔·库基(Michael Cucchi),Pivotal的产品市场总监,对这一过程及其背后的原因提供了更多的细节。按照库基所说,客户虽然喜欢“Pivotal大数据套件的灵活性”,但他们的购买偏好却在发生变化,这其中的原因在于“这些日子客户想尽办法来争取同开源技术相结合,特别是在IT的基础设施领域”。所以结果就是,Pivotal决定开源其大数据套件的核心部分,并且库基也提到他们意图开源其套件的所有组件。

按照库基所说,开源的过程已经“进行了一段时间”,主要是处理一些复杂的事情,比如软件许可、知识产权和产品管治,并为后面的行动提供一些细节。

详细的计划还正在敲定中,但是Pivotal已计划按季度的节奏来开始发布和孵化Pivotal GemFire、Pivotal HAWQ和Pivotal Greenplum Database。现在Pivotal已接近完成GemFire、Greenplum Database和HAWQ代码所有权的结构改造,使其成为最适合大数据社区工作的实体。

Pivotal还宣布成立ODP(Open Data Platform)组织,初创的15个公司包括Hortonworks、IBM、Infosys、GE、SAS等,这些公司致力于推进大数据领域的开源和标准化。第一批被ODP关注的组件包括Ambari、HDFS、MapReduce和YARN,而且Pivotal很可能会将其套件的源码委托给ODP来管理。

于此同时,Pivotal的大数据组件还进行了一些服务上的增强:在Cloud Foundry上利用Operations Manager来部署套件的能力;以及同Spring XD(Pivotal的大数据集成运行环境)、Redis和RabbitMQ进行集成。按照库基所说,下一个版本的Pivotal HD(Pivotal的Hadoop发行版)将会同Spark以及“所有可用的Apache项目”进行集成。

查看英文原文:Pivotal Open Sources Their Big Data Suite

你可能感兴趣的:(Pivotal 开源其大数据套件)