本文作者:汪源,网易副总裁,网易杭州研究院执行院长,网易数帆总经理
原载:公众号“冷技术热思考”
网易数帆开源全景图
今年数字+大会上我们第一次比较系统的推出了我们的开源计划(sf.163.com/opensource),将“架构开放、内核开源”作为我们的核心战略,尽可能的减少客户绑定,引起媒体的广泛关注。
媒体经常会问我们开源怎么赚钱,一些同事也问过我同样的问题。网易数帆是一家商业化组织,为什么要做开源,而且还把项目捐赠给基金会(今年我们把Kyuubi项目捐赠给了Apache基金会),放弃控制权,难道数帆是活雷锋吗?我想不如写篇文章把我们的背景,对开源的思路向业界和同事们更彻底的说说明白。因为工作原因我只会讲面向企业的基础软件方面的开源。
这应该也不是我们一家公司遇到的问题,记得阿里的李飞飞老师在一次采访中也说开源其实内部也有很多讨论和争议,所以我们的思路可能也有些参考价值。
在切入正题之前,得先介绍几个背景故事,因为这些故事对我们开源战略、策略的形成有很大影响。
故事一:国产数据库。2003年,我们浙大数据库课题组的一行人承担了国产数据库的研发工作,我负责执行器。我们的基础是PG。因为我们把存储和事务层完全重写了,我的执行器自然也要大幅修改来对接。我嫌PG的代码写的不好,可读性差(特别是mergejoin的next方法1200行贼难读懂),性能也不好,因此大刀阔斧把整个执行器全部重写,可读性好了,性能也高了,当年在科技部的评测中遥遥领先位居第一。这看似是好事,但过了不到三年大家都向我抱怨说因为我的重写,PG新版本的特性完全没法移植。这件事对我震撼很大,让我意识到和社区脱节可能带来严重后果。
故事二:NEMR。2007年公司业务有了大规模数据分析的需求,看了Hadoop发现太不成熟,当时团队提议不如自研一个,就立项做了NEMR(NetEase MapReduce),一时确实比开源的Hadoop好,功能更强,性能也更高。但到了2010年,我们最终发现社区Hadoop已经更成熟、更强大,所以决定废除自研的NEMR,迁移到Hadoop。回头去看的话我们本可以有两种选择,要么以开源Hadoop改进,这样我们就不会重复造轮子,要么从一开始就把NEMR开源,这样说不定最后胜出的是我们。
故事三:DDB。我到网易做的第一个项目是分布式数据库中间件DDB,2005年底启动,很可能是业界第一个通用的分库分表中间件。DDB现在还在公司很多产品中大规模使用,从应用来看是非常成功的,但这几年业界也出现了较为成熟的开源分库分表中间件,如ShardingSphere。久而久之,可能我们的DDB也将要被淘汰。如果DDB从一开始就开源结局会怎么样了,可能就没ShardingSphere等什么事了。
这几件事情给我有很大的震撼,深切感受到做基础软件不开源很难成功,也尽可能不要脱离社区。如果我们费劲力气开发了一个软件,最后却被开源软件取代,那我们创造的价值在哪里?
最后一个故事:老板。之前公司没有开源战略,但2019年老板开始明确的让我们做开源。2019年是公司很多年来财务压力最大的一年,但就是在这一年,老板不但没有压缩我们任何一个做基础软件研发的人,还明确提出要做开源。如果公司在很赚钱的时候说要做开源,将来遇到困难,还可能难以持续,在困难的时候提出做开源,我想这是老板给我们做开源最大的定心丸。
我们要解决的第一个问题是开源战略,也就是为什么要做开源。如果没有开源战略,开源就只是某个个人或者团队的行为,这样的开源不可能持续(除了那种创始团队跑出来继续的情况)。对公司而言,如果这个项目基本没人知道的话,没啥意义,如果曾经还搞出点影响力,影响反而是负面的,可能导致公司后续的开源都被业界怀疑。
为什么要做开源,我想可以归结为三点:1、开源才能改变世界;2、开源有助于增进创新和分享的公司文化;3、开源自然也会名利双收。
1、开源才能改变世界
我说的“改变世界”没有那么高大上,对于企业级基础软件来说,就是要做到全世界很多国家很多行业都在用。
开源才能改变世界,是经历了背景故事中多个项目黯然神伤的深切体会,Linux、K8S、MySQL、Hadoop、Spark、MongoDB、Redis等大量的案例更可以证明开源是“独立”基础软件实现成功的主要方式,包括我们开源不久的Curve和Kyuubi。据说有三家集成商已经用Curve来交付项目了,而腾讯云、eBay、H3C、海康威视、中移动、小米等不少这么大的企业已经在用我们的Kyuubi。如果不是开源,不可能有这样的成绩。
这里的限定条件是“独立”二字。“非独立”的基础软件不需要借助开源也能成功,开源可能意义不大。如iOS就不开源,AWS等云产商做了大量的基础软件,也都不开源。云产商做开源的逻辑就比较难讲,也难怪乎飞飞老师说开源一事有争议了。
2、开源有助于增进创新和分享的公司文化
创新是公司核心文化之一(另两条是热爱、和用户在一起)。我们没有什么平台模式网络效应可以凭借,所有业务都得拼产品、拼技术、拼运营,最终都要拼创新。另一方面,公司也非常提倡共享的文化,每年1024程序员节上都会奖励技术成果的共享与共建。
开源可谓推进创新和共享文化的最佳手段。开源可以让技术接受全世界的评议,看是不是真的有用的创新,还是闭门造车自吹自擂,或是为了创新而创新搞出来的怪胎。一个技术如果只是自己做自己用,怎么知道是否先进呢,所以我们鼓励要么开源,要么商业化,接受客户的检验。基础软件这样的公共技术一般没什么业务特殊性,要么做一个最好的,要么就不要做,用已有最好的。开源可以促进共享这点更不必多说,开源不但是分享给世界,也是分享给公司别的部门。大公司总有一些部门墙,开源是最容易突破部门墙的。
3、开源自然也会名利双收
名一方面是公司的技术品牌。因为开源项目的成功肯定是业界公认,对企业技术品牌的价值就非常大。比如我觉得百度在AI领域的技术品牌跟PaddlePaddle有很大的关系,一个PP抵得上不知道多少个大赛冠军。名的另一面是企业的社会价值,开源是软件企业反哺社会的一种重要方式。最后,技术品牌和社会形象也就是人才吸引力。
最后说到利。同事们问我这个问题的时候,我都说,如果我们做的这个软件真的全世界都在用,我们作为开创者和主要的贡献者,我们基于这个项目去给客户提供增值服务,会发愁赚不到钱吗,多少总能养活自己吧。记得当初取名“有道”的时候,有一个说法是有道可以解释为“君子爱财、取之有道”。开源,帮助到千千万万的客户,然后顺便赚点钱,也可以说是“君子之道”。
开源策略方面第一个核心问题是:哪些开源,哪些不开源。这个问题又包含两个子问题,哪些项目适合开源和哪些部分适合开源。
有两类项目最适合开源:
还有一些其他因素需要考虑:
哪些部分适合开源的问题,我们的考虑是“内核开源”,这也是业界典型策略。内核开源,对客户和生态来说就可以体验到完整的基础功能,满足应用需求。但大型企业如果作为技术战略应用的话,还需要很多安全、治理、监控、计量计费等等“企业级”功能,这些功能可以作为商业版本的特有功能,也没那么标准化,开源爱好者也搞不懂。我今年打过一个比方说采用一个基础软件就像结婚,要慎重,一旦遇人不淑,离婚可不容易。内核开源类似于让你可以深入了解一个人的品行,保证不会遇人不淑,但是你还得花钱买“企业级”的功能和服务,就类似你找到了真爱,但经济上还得自立。
开源策略第二个核心问题是:要放弃控制权,捐赠给基金会。这是因为捐赠给基金会有助于软件的成功。基金会运作更能被客户接受,因为这样才可能有多家供应商能提供服务,才能形成健康的软件供应链。我一直认为,如果一个软件只有一家能做并不是好事,这家公司不可能成功,因为对客户来说这样会面临极大的风险。放弃控制权,培养几家竞争对手,大家才能一起成功,否则谁都成功不了。另一方面,捐赠给基金会,也便于借助基金会扩大影响力。
捐赠给基金会面临的一个问题是:如果IaaS巨头来薅羊毛怎么办?为了防止IaaS巨头来薅羊毛,Redis和MongoDB都改了开源协议,如果捐赠给基金会,就没办法这么干了。这样的风险当然存在,但如果自身能力过硬,应对及时,风险并不大。在一次采访中,Databricks的CEO Ali Ghodsi是这么说的,之所以出现一些基础软件产商被IaaS巨头来薅羊毛,是因为这些产商不擅长做云服务。软件已经很流行了,原厂又没能力提供云服务,IaaS巨头提供一个云服务也是为了更好的满足客户需求。所以要避免IaaS巨头来薅羊毛,根本上是要靠自身产品化能力过硬(一般开源的只是内核,不包含所有产品)、商业化和云服务运营能力强,并且在合适的时机就在各大云平台提供对应的云服务,这样我相信原厂的云服务自然是最畅销的。像Spark就和云产商合作的很好,TiDB看起来也不错。当然IaaS巨头的服务也会有市场。
所以要不要捐赠给基金会,取决于你的思维方式是做蛋糕还是分蛋糕。
战略上认可开源,策略上也想清楚了,接下来是具体怎么做的问题。
头等大事是经费来源。虽然我们说了很多开源的各种价值,但这些价值主要是对企业整体而言偏长期的价值,所以开源的经费来源要尽可能的来自于企业的最高层,越高越好。以我们为例,我们的开源项目主要是放在研究院的公技板块,由集团设立和给预算经费,因此开源并不占用网易数帆BU的成本。因为在公技板块,我们的开源项目都是因为集团自身业务有需要而立项,并非为了赚钱,只是觉得做得好了说不定也能给数帆赚点钱。这样,公技就踏踏实实做开源,数帆就跟着开源的进度,到合适的时候再试试怎么围绕开源去赚点钱,能赚到当然好,赚不到也不亏。所以,虽然是在数字+大会上发布,但实际上并不是数帆在做开源,而是研究院在做,更进一步说是集团在做开源。我在数字+讲开源的时候,其实更多的是代表研究院而非数帆。
大家可能对我们研究院不太了解,那还可以拿阿里类比一下,就类似行癫(达摩院和阿里云智能的共同负责人)来发布阿里的开源战略,让达摩院踏踏实实做开源,如果做的好的,阿里云来围绕开源赚钱。虽然阿里云做的很大了,但毕竟是个要赚钱的部门,做开源难免纠结。
我们的机制可以归结为集团开源,BU赚钱。我觉得我们这样的机制才能保障开源的“诚意”和“长远”,唯一的前提是大老板要支持,幸运的是老板很支持我们做开源。
第二个是要做好开源项目的管理,不要让不好的开源项目损害公司品牌。开源项目多了,就要建立开源管理委员会,新开源项目都要经过委员会审议,每年每个项目都要向委员会汇报工作和计划。每个项目的价值也要严格评估,只是不评估赚钱而已,但社区情况、应用情况、影响力情况、技术创新与先进性、团队能力等等都要评估,据此确定预算。我们目前还没有正式建立委员会,但杭研和数帆的每个项目要开源也都是我要审批的。后续考虑到项目多了,很可能会建立一个更规范运作的委员会组织。
以上都侧重于自研开源,实际上我们对开源不仅重视自研开源,更重视开源引入和社区贡献。我们已经连续三年在HR和技术委员会(TM599)组织下开展了三类开源的评选,每年在10.24期间颁奖,以此促进公司的开源文化。
第一提倡的是开源引入,也就是奖励优先采用已有的开源技术并分享开源经验。每年这类奖励的数量是最多的,这是为了尽可能的促进复用,反对重复造轮子。我经常讲,软件最大的优势是只有研发没有生产,只有软件才可能做到不重复造轮子,理论上我们写的每一行代码都应该是创新的,独特的。工业时代每个人都在重复造轮子,米其林是不会说我们要让每个轮子都不一样。可以不用重复造轮子,是我们做软件的拥有的最大优势,尽可能不要把自己的聪明才智浪费在重复造轮子上。
第二提倡的社区贡献。为什么要给社区做贡献争取成为Committer,而不是自用就好?这有几方面的考虑。首先,通过最专业的同行评议可以确保我们的方案是好的;其次,解决方案被社区接受能够极大的降低自己分支的维护成本。如果不积极为社区做贡献,一段时间之后很容易出现和社区分岔太多,merge不了社区最新进步,就如当年我做国产数据库时一样,伤害极大。正因为如此,我们才在OpenStack(曾位列nova项目年度中国第一)、Spark(拥有Committer,国内似乎才5名)、Harbor等项目上都积极贡献。当然,最后还有就是对公司技术品牌的价值。
最后才是自研开源。自研开源其实是已有开源技术确实无法满足时的无奈之举,因此我们往往都是在应用过开源技术,发现确实有无法解决的问题时,才被迫自研然后开源。比如我们是在大规模应用了Ceph(百PB级),发现Ceph因为基础设计的不足导致可用性、可维护性和性能问题无法解决时,才自研Curve存储。
这样的策略,对内能够最大程度的降低重复造轮子,对外可以最大程度的保证自研开源项目个个是精品。
本文既是对我们开源的全面介绍,给业界和同事的回答,也或许可为业界做一参考。开源是为了做出成功的基础软件,为了推进创新和复用的文化,也有名和利。开源的无私和商业的自私之间要取舍和均衡,谈开源不必避讳商业利益,从开源中赚钱,可以说是“君子爱财,取之有道”。我们通过集团无私投入做开源,事业部顺便看看是否能赚钱的机制,力求让我们的开源“诚意满满”和“可持续”。