韩卿:Apache Kylin的开源故事

个人简介 韩卿(Luke),Apache Kylin co-creator, PMC 成员,现任eBay GDI部门高级产品经理,在大数据,数据仓库,商务智能等方面拥有超过十年的经验。现负责Kylin产品的设计,规划,战略和执行,开源社区负责人,开拓内外部客户,合作伙伴等。在这之前任eBay BI平台高级架构师,带领团队为eBay全球商务智能平台提供管理,架构,开发等。 eBay GDI(Global Data Infrastructure)是eBay的全球数据基础架构部门,负责eBay在数据库,数据仓库,Hadoop及商务智能等各个数据平台的开发,管理等,支持eBay全球各部门运用高端的数据分析解决方案作出及时有效的业务决策,为遍布全球的业务用户提供数据分析解决方案。

QCon是由InfoQ主办的全球顶级技术盛会,每年在伦敦、北京、东京、纽约、圣保罗、杭州、旧金山召开。自2007年3月份首次举办以来,已经有包括传统制造、金融、电信、互联网、航空航天等领域的近万名架构师、项目经理、团队领导者和高级开发人员参加过QCon大会。

   

1. InfoQ的网友大家好,现在我们是在QCon北京的现场,做客我们专访间的是eBay全球数据基础架构部高级经理韩卿先生,请韩经理先给我们介绍下Apache kylin吧。

韩卿:好的,Apache麒麟是一个在Hadoop及Spark之上的大数据的分析平台,它提供了一个SQL的接口以及多维分析的能力,可以支持大规模的数据查询,能够提供非常好的查询延迟,能够很好的跟现有的BI工具进行无缝整合。

   

2. 麒麟为什么会选择开源?在开源之前做了哪些准备工作呢?

韩卿:选择开源是因为我们使用了非常多的开源框架、工具。从公司角度来说,我们非常希望能够反馈给开源的社区,能够把我们的技术能力贡献出来,另一方面从项目的角度来说,能够吸引更多的人一起做更多的Feature, 帮我们把这个项目做得更好。在开源之前主要是做了很多准备工作,最重要的是我们从一开始就定下了要开源的基调,所以就要Open source from day one,从公司层面和我们团队的层面都做了这样一个准备,对整个团队成员以及客户,我们的想法从一开始就奔着开源的方向去做了。所以接下来的一些工作也都是为了开源去准备的。我们核心的代码跟我们内部部署的特定的一些东西是完全分开的,这样就能很容易的把核心内容开源出去,而我内部的一些代码是不需要暴露出来的。另外一方面,我们申请了一个美国的专利,这是为了保护我们自己,不让同样的东西让其他的人申请后反过来给我们麻烦,这是一个很重要的工作。还有一些工作是要具体使用什么样的license,因为从一开始就明确我们是要开源的,所以在选用一些依赖库的时候就需要非常的注意,不去选用一些GPL之类要求严格的开源项目。在团队成员之间,我们对开源的认知,和整个开源过程都是非常在意的,为开源做了很多的准备。

   

3. 2014年10月开源,而11月就加入了Apache孵化器项目,能介绍下申请加入Apache项目的流程吗?当时为什么要加入Apache,出于哪方面考虑呢?

韩卿:我们开源之后呢,业界收到了非常好的反馈。包括了hotworks的创始人等一些业界非常有影响力的人,都给了我们非常积极的反馈。之后他们跟我们进行了很多的交流,由于很多人都是Apache的成员,甚至是委员会的成员,在交流过程中,他们就邀请我们,说我们的项目跟hadoop接近,可以加入Apache。大家也知道hadoop有相关的生态系统,现在几乎都在Apache上,既然我们做的也是hadoop之上的分析引擎,那就在一起吧。

   

4. 你是如何定义开源社区的?你们是如何运营麒麟的社区的?

韩卿:社区并不只限于论坛,更重要的是围绕着你项目的这群人,包括了你的开发者、使用者和客户,包括了所有跟这个东西相关的东西。我们对社区的定义是你如何在这些人之间,基于这个东西沟通交流。包括线上线下,类似QCon的交流会,我们把这些都定义为社区的一部分。 至于如何运作这样的一个社区,首先需要有很好的网站,总是要有一个门面把你的东西展现出来,我们也花了很多力气在一些社交媒体上做工作,特别在美国。这不仅仅是通过社交媒体发布新闻,更重要的是你去关注什么。举个例子,别人在推特上@我们,给我们提出意见和建议,你得去跟进。我们刚刚开源的时候,有人在hacker news上给了我们很多评论,提了很多问题,包括现在也有很多这样的使用者,以及刚刚接触的人会向我们发邮件问很多的问题。我们团队会非常积极的响应这部分内容,积极的去跟进去并回答这些问题,做到有问必答。让别人知道我们非常乐意去分享,这方面有很多类似的工作要做。因为我们开源出来目的是希望有更多的人去利用它,并且利用的更好,并希望他们在利用的很好的情况下能够给我们反馈。 我们同时也在非常积极的参与一些相关的线上线下活动,去让更多人知道这个情况。包括北美那边硅谷那边,有非常多的一些meetup,Hive meetup,Spark meetup等,我们自己也举行过Kylin的meetup,我们去年在北京也举行过一次。我们也非常积极的参与一些峰会,包括上个礼拜在北京举行的数据库技术大会,今天的QCON,还有接下来我们去去英国参加Strata+Hadoop World等等,希望通过这样的努力运作,让更多人去了解和使用我们的开源项目,能够去培育整个社区。

   

5. 深度接触Apache这么长时间,可以分享一下您印象比较深刻的Apache开源项目的运营经验吗?

韩卿:对于Apache其他的项目我不是特别的熟悉,我能分享的是我们在这个过程中的一些经验。刚才也提到了我们为什么会去Apache,还有个非常重要的原因是:在开源社区里面,Apache的整个运作方式和社区的成熟度是全球最高的。它基金会的整个管理模式,运作方式方法等都是非常成熟的。大家也非常认可这样的一个品牌社区,这是非常重要的一个原因。Apache的经验是,它会更注重于构建社区,而不止是写代码,这是非常不同的地方,并且它提供了非常多的流程来帮助你做。比如我们进去的时候会有mentor,指导我们怎么去写proposal,怎么加入进去,怎么去熟悉Apache的流程,它有非常好的人来帮你。这样的流程可以来帮助你高质量的完成开源项目,在这方面它管得非常严格。这么做的好处是当别人在使用的时候能够完全认可,因为这是来自Apache的项目。Apache本身规范的流程与品牌影响力对运营一个开源项目是有非常大的帮助的。

你可能感兴趣的:(韩卿:Apache Kylin的开源故事)