Steve Yegge, Amazon的前员工,现任Google员工,其本来想在Google+上和Google的员工讨论一些关于平台的东西,结果不小心把圈子设成了Public,结果这篇文章就公开给了全世界,引起了剧烈的反应。发布后很快他就马上把这篇文章删了,不过,互联网上早备份了下来——SteveY’s Google Platforms Rant。后来,Steve在其Google+上作了一些解释,大体是说他喝多了,而且又是在凌晨,所以大脑不清,文章中的观点很主观,极端且不完整,还有Google的PR对他很好,等等,等等 。
几个星期前看到时就一直都想翻译一下这篇文章,不过因为最近事情太多,文章又很长,所以现在才翻译完成,翻译的不好,还请大家指正。
在你阅读正文以前,我想说明几点,希望你注意一下:
我曾在Amazon工作了六年半,现在,我在Google的日子也差没不多这么长了。对于这两家公司,有一件事总是萦绕着我——这种感觉一天比一天强烈──那就是,Amazon每件事都做错了,而Google每件事都做对了。当然啦,这是很笼统的话,但却是惊人的准确,相当的疯狂吧。大概有一百甚至两百种不同的地方可以让我们去比较这两个公司,而Google可能在每一项都能胜出,如果我记的没错,除了其中3项以外。因为,我曾用电子表格把这些项都列出来了,只是法务部门不会让我给任何人看,即使人事招募部门很喜欢这个报表。
这里,让我先给你个例子让你稍微体会一下:Amazon的人事雇用流程有根本上的缺陷,因为各个团队各招各的人,以至于,各团队之间的招聘标准相当的不一致性,即使他们通过各种努力来统一标准,但是实际操作上却是一团糟;他们没有真正的SRE(陈皓注:Site Reliability Engineer ),工程师们什么事都要做(陈皓注:所谓SDE – Someone Do Everything)、几乎没时间编码。当然,不同的部门有不同的情形,不过,这取决于你的运气。他们不搞慈善,也不帮扶贫困人群,也不搞社区贡献,或是其它相似的活动。在那里,他们从来不谈这些,或许只有在说笑话的时候才会提到。他们的办公环境是个灰尘及污迹四处的像农场一样的隔间,他们在公共区域连一分钱装修的都不会花,而且,他们的薪水和福利相当差,只是近来与Google和Facebook竞争人才,这个差距才变得非常地小。不过,他们没有我们有的津贴或额外奖金——他们只是给你录用信上的那个数字,就这么多。他们的程序代码完全就是灾难,无论什么都没有任何的工程标准,除了各别团队有一些。
公平起见,他们的确有套非常非常不错的版本控制管理系统,而这是我们(Google)需要尽力赶上他们的地方,他们还有一个漂亮的发布/订阅系统,我们也没有相对应的东西。不过,就大体而言,他们有的不过是一堆蹩脚的工具,用关系数据库来读取或写入状态机里的信息中罢了。我们不应该这么搞就算这样做是可以。
这就是我所所说的那3件事中的两件事Amazon比Google强的,那就是的他们的发布/订阅系统以及版本控制和管理系统。
我猜你也许会为他们争辩到——他们要更快更早地推出服务并通过狂热地迭代来不断地改进和完善。他们把服务发布的优先级看得比任何事都重,包括工程纪律或是其它一堆可能会让其花时间的事务。所以,即使这么做让他们在市场上有了某种程度的竞争优势,但也造成其他足够多的问题,总之,这样的做法算不上是个漂亮的扣篮。
但是,他们有一件事做的非常非常好,其好到可以把其他政治,理念,技术上的消耗和混乱完全弥补回来。
Jeff Bezos是个臭名昭彰的微管理经理人,他的微管理都管理到了Amazon零售网站上的每一个显示像素。他雇佣了Larry Tesler——Apple的首席科学家,他可能是全世界最有名也最受尊敬的人机交互接口专家,然而,Bezos忽略了Larry三年来提出的每一个建议,直到Larry最后——明智地——终于离开了公司。Larry本应做一些大型可用性(Usability)研究,并可以系统地了解那个根本就没有人能够搞懂、使用那该死的网站,可是,Bezos对于那些像素不放手,这些页面上的那几百万个显示像素就像是他的孩子一样。所以,他的这些孩子还留着,而Larry没有。
当然,微管理不是第3项Amazon做的比我们好的事。我的意思是,没错,他们微控管理做地非常地好,但我不会把这项列在他们的强项清单上。我这样说只不过是为了我下文做铺垫,帮助你了解我后面要说的事儿。我们现在要说的这个人,是在多个严肃的公开场合说要来Amazon工作就应该付他钱才对的人。当有人跟他意见不同时,他会递出写有他名字的黄色即时贴以提醒那个人“谁是公司的老大”。这家伙是……,Steve Jobs,我想,除了没有品味和设计能力,他们很相似。千万别误解我,Bezos是个绝顶聪明的人,只不过他把那些正常的管控搞得像嗑了药的嬉皮士一样罢了。
所以,有一天,Jeff Bezos下了一份命令。当然,他总是这么干,这些命令对人们的影响来说就像用橡皮槌敲击蚂蚁一样。这个命令大概是2002年,我想误差应该是在正负1年内 —— 这个命令发布的范围非常地广,设想很大,让人眼珠子鼓出来的那种,这种惊讶程度和其他的命令相比,就好像你突然收到公司给你的奖金一样让人惊讶。
这份大命令大概有如下几个要点:(陈皓注:这里是本篇文章的要点!如果这真是Bezos发出来的,那么太赞了,Bezos完全就是一个系统架构大师啊,那可是2002年左右啊。作者调侃Bezos完全是正话反说啊)
- 1) 所有团队的程序模块都要以通过Service Interface 方式将其数据与功能开放出来。(陈皓注:Service Interface也就是Web Service)
- 2) 团队间的程序模块的信息通信,都要通过这些接口。
- 3) 除此之外没有其它的通信方式。其他形式一概不允许:不能使用直接链结程序、不能直接读取其他团队的数据库、不能使用共享内存模式、不能使用别人模块的后门、等等,等等,唯一允许的通信方式只能是能过调用 Service Interface。
- 4) 任何技术都可以使用。比如:HTTP、Corba、Pubsub、自定义的网络协议、等等,都可以,Bezos不管这些。(陈皓注:Bezos不是微控经理吗?呵呵。)
- 5) 所有的Service Interface,毫无例外,都必须从骨子里到表面上设计成能对外界开放的。也就是说,团队必须做好规划与设计,以便未来把接口开放给全世界的程序员,没有任何例外。
- 6) 不这样的做的人会被炒鱿鱼。
- 7) 谢谢,祝你有个愉快的一天!
哈哈!你们这150个前Amazon的员工,当然能马上看出第7点是我开玩笑加上的,因为Bezos绝不会关心你的每一天。
不过第6点是很真实的,于是,所以人们都去工作。Bezos并派出了几位首席牛头犬来监督并确保进度,领头的是和熊一样大的牛头犬:Rick Dalzell,Rick是以前是陆军突击队队员,西点军校毕业生,拳击手,和沃尔玛的首席虐刑官 / CIO,而且他也是个高大、和蔼、令人敬畏的人,还是经常使用”hardened interface”词的人,Rick 本来的走路和说话都比较hardened interface,所以不用多说,每个人都得干 出有重大的进展,这样Rick才能看得见。
在接下来的几年,Amazon内部转变成面向服务架构SOA(Service-Oriented Architecture),在这华丽转身的过程中,他们学到了相当巨多巨多的东西。我在的那个时候,世界上就有很多很多的关于SOA的学术文档,但在Amazon的那种超大规模的面前,世间的这些文档就好像告诉印第安纳琼斯(陈皓注:电影夺宝奇兵男主角)过马路前要先看看两边有没有来车一样没用,Amazon的研发工程师们在这个过程中发现了很多很多的问题,并从中学到了很多。下面只是他们这些问题中的沧海一粟:
上面这些只是极少数几个例子,在Amazon在进化的过程中,Amazon遇到这样的问题可能一打甚至数百个,Amazon都一一学习和总结了。对于把Service外部化甚至还有很多几乎没有人会想到的非常生僻的东西,当然,也不会有你想像的那么多,Amazon都学到了。把业务组织成Service让团队学会了不能相信对方,就如同他们不能信任公司以外的程序员一样。
当我在2005年中期离开Amazon加入Google时,这个努力进化的过程还在进行时中,但那时已经相当的先进了。从Bezos颁布法令的时间到我离开的时候,Amazon已经把文化转变成了“一切以Service第一”为系统架构的公司,今天,这已经成为他们进行所有设计时的基础,包括那些绝不会被外界所知的仅在内部使用的功能。
那时,如果没有被解雇的的恐惧他们一定不会去做。我是说,他们今天仍然怕被解雇,因为这基本上是那儿每天的生活,为那恐怖的海盗头子Bezos工作。不过,他们这么做的确是因为他们已经相信Service这就是正确的方向。他们对于SOA的优点和缺点没有疑问,某些缺点还很大,也不疑问。但总的来说,这是正确的,因为,SOA驱动出来的设计会产生出平台(Platform)。
是的,这就是Bezos的法令要达成的目标。他以前(现在也是)一点不关心各团队是否好,也不关心他们使用什么样的技术,实际也不去管他们如何运作他们的业务,除非团队开始把事搞砸。但是,Bezos比绝大多数的亚马逊人都很早很早就领悟到,Amazon必须成为一个平台。
如果是你,你会想到要把一个在线卖书的网站设计成为一个有扩展性,可程序化的平台?你真的会这样想吗?
嗯,第一件Bezos领悟到的大事是,为了销售书籍和各种商品需要的基础架构,这个基础架构可以被转变成为绝佳计算平台(Computing Platform)。所以,现在他们有了Amazon Elastic Compute Cloud(亚马逊弹性运算云平台EC2),Amazon Elastic MapReduce,Amazon Relational Database Service(亚马逊关系数据库服务),以及其他可到AWS aws.amazon.com查得到的一堆Service。这些服务是某些相当成功的公司的后台架构,比如 我个人喜欢的 reddit 是这一堆成功公司的其中一个。
另一大领悟是,他知道他们不可能永远都创造出对的东西。我认为,当Larry Tesler说他妈妈完全搞不懂怎么使用那个该死的网站时,Bezos的某根筋被触动了,当然,我也不清楚到底是谁家母亲,这无关紧要,因为没有人的母亲能够会用那个该死的网站。事实上,连我这个在那工作超过5年的人都觉得Amazon网站的接口令人胆战惊心。
我并不是很确定Bezos是如何领悟到的——领悟到他不能创造 出一个产品能适用于所有的人。不过,怎么来的这不重要,重要的是他的确领悟了。这种事有一个正式的术语,叫Accessibility,这是计算机世界中最最重要的事情了。
最!重!要!的!事!
如果你在心里面在想“哼?你是说,像盲人和聋人那种Accessibility吗?”,那么,你不是唯一这样想的人,因为我已经知道有很多很多像你这样的人:这种东西对你们这种人来说是不可能有正确的Accessibility,所以这事你还不能理解。当然,不能理解也不是你的错,就像眼盲,耳聋,或是其他行动不便的残疾人,这些也不是他们的错。当Software——或ideal-ware——如果因为某些原因不能被存取或使用,那么,这就是软件或是那想法的错了。这就是Accessibility failure。
就如同生命中那些重大的事一样, 每个事都有一个邪恶的双胞胎姊妹,它在幼年都受到父母的溺爱,现在它已经成长为同等强大的复仇女神(是的,Accessibility有不只一个复仇女神),这个复仇女神叫安全性(Security),他们在一起总是争执不休,冤家一对。
不过,我会和你争论Accessibility要比安全性来的重要多了,因为零Accessibility就意为着你根本没有做出产品来,而如果安全性为零,你仍然还是可以有一个某个程度上成功的产品,譬如说Playstation Network。
对了,也许你还没注意到,我其实可以为这篇文章写出一整本书,很厚的一本,其中填满了那家我曾工作过的公司里关于蚂蚁与橡皮槌的事。但是,我可能也就永远无法在这发表这短篇的夸夸其谈了,而你也就无法读到除非我现在开始结尾。
那三件Amazon比Google强的中的最后一件事是,Google很不会做平台(Platform)。我们就不懂什么是平台。我们就根本不知道平台的内涵。你们其中一些人明白,但是你们是少数派。在Google过去这六年来,越清楚这一点就越让我痛苦。我曾有一线希望,来自Microsoft和Amazon,以及近来Facebook的竞争压力,会让我们全体人都清醒过来,并开始打造我们公司的Service。不是那种特制的或半生不熟的,而是多少和Amazon的类似的那种:一次到位,真正的,没有作弊或是欺骗,并且把它放在最高优先级的位置。
但实际上却不是,这个事被放在了好像是第10还是第11位,或是第15位,我不知道,反正是相当低。只有少数几个团队严肃地看待这个事,但大多数的团队不是从没有思考过这个事,就是只有一很少的人很鼠目寸光地在看待这个事。
对大多数的团队来说,只要是让他们以提供给别人那种可程序化的方式存取他们的数据与运算的方式来开发软件,就算几个小小的粗糙的Service,对他们来说也是翻天覆地。他们大部分人都认为他们在做产品,但他们只是在提供那些凄惨粗糙的Service。回去看看前面我所列的那些部分的Amazon学到的东西,然后告诉我,哪一个粗糙的Service能让你有超凡脱俗的产品。迄今为止,就我所知,一个也没有。就算是这些粗糙的东西很不错,不过这就好像要汽车的时候,你却只有汽车的零件。
没有平台的产品是没用的,再精确一点,去平台化的产品总是被平台化的产品所取代。
Google+是我们完全失败的不懂Platform最明显的例子,从最高层的管理层(嗨,Larry、Sergey、Eric、Vic,你们好)一直到最最底层的员工(嘿,你)都不懂。我们全部统统都不懂。平台Platform的黄金守则是Eat Your Own Dogfood(吃你自己的狗食——自己都要用自己的平台)。Google+这个平台是个杯具的事后抄袭者。我们在发布它的时候完全没有任何API。我查了一下,目前也只有少得可怜的API。Google+的一个团队的成员在发布API时告诉我这个事,我问:“这是Stalker API(用来偷窥内部数据的API)吗?”,她郁闷地说,“是啊”。我的意思是,我那只是个玩笑话,但是,不,我们提供的唯一的API就是取得某人的信息流,所以,我想我把玩笑开到自己头上了。
Microsoft知道“狗食守则”至少有20年了。这已经成为他们世世代代文化的一部分了。不能是你吃人类的食物而给你的开发人员们喂狗食。那样做只会是为了短期的成功而掠夺了平台长期价值。平台就是要你考虑得长远。
Google+就像膝跳反射,一种短视的的东西,是基于以为Facebook其伟大产品的成功作出的错误判断。但那不是为什么他们能成功的东西。Facebook的成功是因为他们建立了一个可以让外界在其上上面开发的产品群。所以对Facebook对每个人来都不一样。有些人把全部时间花在“Mafia Wars”上,有些人则是花在“Farmville”(开心农场)。那里还有成百上千个不同的高质量的时间消耗类的游戏,所以,人们总是可以在那里找到他们想要的。
我们的Google+团队看了看说:“哎呀,看来我们需要一些游戏,让我们去找一些人来为我们写些游戏吧”。你是否开始看到这样的的思考有多么不靠谱了吗?问题在于我们试图在预测人们想要什么,然后推出产品给他们。
你不能这么做。真的不能。也不可靠。在这个世上,甚至在整个计算机的历史上,只有极少数几个人能够这么干,Steve Jobs是其中一个。但是我们没有Steve Jobs。对不起,我们真的没有。
Larry Tesler有可能说服了Bezos相信他并不是Steve Jobs,但Bezos意识到他不需要成为Steve Jobs也能提供给所有人好的产品:大家感到容易使用的接口与工作流。Bezos明白他只要有让第三方开发人员来做的平台,这些东西自然就会有的。
我要向一些人道歉,这些人会觉得我所说的是再明显不过的了。是的,的确是巨明显的。只是我们没有去做。我们没有领会平台,我们也无法领会到Accessibility。这两者本来就是同一件事,因为平台会解决Accessibility。而平台就是Accessibility。
等到你为Microsoft与Amazon提供的平台感到神奇后,当然,我想也你可能会被Facebook吓到(我不敢去看,因为我不想让我太沮丧),让我们回头看看 developers.google.com 。是不是有很大的差别?我们的这个平台看起来像是你家小学五年级的侄子搞出来的东西一样——让一个小学五年级的学生,试着为一个强大的的平台公司去设计平台,就像像我们问这个小学生:“如果这家公司什么资源都有,那你会做出个什么东西来?” 一样。
这里请不要误解我——我知道一个事实,dev-rel 团队为了发布这些API曾经不得不去“搏斗”。据我所知,这个团队很不错,因为他们知道什么是平台,并且他们如英雄般努力挣扎地要做出来,然而遇到的却是“平台冷漠”的环境,难听点还是那种有敌意的环境。
我只是在直白地描述出一下 developers.google.com 在外人眼里是什么样子。它看起来很幼稚。Maps APIs在哪呢,老天啊?其中有些东西还是实验性的项目,我点进去看的APIs……他们都毫无价值。他们很明显都是些真正的狗食。甚至都称不上是好的有机食品。跟我们内部APIs比起来,他们全部简直就是猪屎马粪。
当然,也不要错误地理解我对Google+的看法。他们还不算是最差的。这是文化氛围的事。我们现在做的简单来说就是要进行一场战争,是一场失败很多的少数的平台派和那些强大的信心坚持的产品派的战争。
那些从头到尾明白理解供外部可程序化的平台概念的团队都是受压迫的人——Maps跟Docs团队浮现在我脑海中,而且我也知道GMail是这个方向的先头部队,但是他们很难得到资金注入,因为这不是我们文化的一部分。Maestro的资金完全没法和Microsoft Office开发平台的资金相比:就像小白兔和暴龙相比一样。Docs团队知道自己永远无法和Office竞争,除非他们能赶上Office的脚本能力,而且他们得不到他们相要的资源。我的意思是我假定他们没有,现在应用的脚本能力只在电子表格中有,而且没有为API设置键盘快捷键。在我看来,这个团队完全没有被重视。
具有讽刺意的是,Wave是个伟大的平台,愿他能安静地长眠。我们需要知道,做一个平台并不会马上给带来成功。平台需要杀手级应用。Facebook——他们供应了的涂鸦墙和朋友关系网等其他东西——则是Facebook平台的杀手级应用。但是,如果你说没有Facebook平台,仅有Facebook应用也能像今天这样成功,那么,这会是一个非常严重的错误。
你知道吗?人们总是在说Google的傲慢自大。我是个Google人,所以我和你一样当听到那些话都会觉得很愤怒。但总体而言,我们并不傲慢。我们大约99%不自大。我在文章开头时就写到——如果你回去看看—— 我是这样描述Google的“所有的事都做对了”。我们知道人们为什么要这么说我们自大,因为我们没有雇用他们,或是因为他们对我们的政策不爽,或是那一类的事情。他们推断出我们自大是因为这样会让他们心理平衡一些。(陈皓注:作者在这里的反话正说)
但是,当我们摆出那种我们知道怎么给用户设计出完美的产品的姿态时,你最好相信我,我们就是笨蛋。你可以说是自大,天真,或是别的什么,无所谓,但最终的结果就是我们干的很愚蠢。因为,这世界不可能有一个产品对所有人都是完美的。
你看,我们的浏览器居然不能让人设定默认的字号。这就是我们对Accessibility的公然冒犯。我的意思是,我总有一天会老的,我也会得老花眼,并会变瞎的。我的意思是我不会变瞎,但是如果你到了40岁,你的老花眼让你看不清近的东西。那么,字号的选择会成为生和死的问题:某用户就会被完全排除在产品之外。但是Chrome团队就是这么NB傲慢:他们想要开发出无需配置的产品,他们对此相当自豪,去你TMD是瞎子还聋子,管你是谁,在你剩下的日子每访问一个页面都按一下Ctrl-+吧。
并不仅是他们是第一个。问题是,我们是一家“产品”公司,一直一直都是。我们开发的最成功最有吸引力的产品——搜索引擎,那样巨大的成功让我们产生了很多定式和偏见。
也许,Facebook只是看一眼我们,就问到:“我们如何击败Google?他们少了什么?”
我们面对的问题非常的庞大,因为我们需要经过剧烈的文化转变后,我们才能迎头赶上。我们没有内部的SOA平台,所以我们外部也没有。这就是说,我们整个公司都“没有领会到”:产品经理没有,工程师没有,产品团队没有,没人领会到。就算是个别人有,比如你你有,那也相当于没有,除非我们在生死存亡的时候。我们不能这样不断推出产品,并装作我们以后会把这些产品转变成迷人美丽的可扩展式的平台。我们试过了,不行。
平台的黄金守则,“Eat Your Own Dogfood 吃自己的狗食”,换句话说,“先打造出自己使用平台,然后把它用在所有的地方”。你不能事后再做,那样做就太困难了——你去问问那些把MS Office平台化、把Amazon平台化的人。如果你放在后面做,那么你比一开始要花十倍的精力才能做对。你不能作弊,你不能让内部软件走秘密通道以取得特定的优先权限,不为什么,你必需从一开始就要解决这个问题。
我不是说现在做已经太迟了,但我们等的越长,我们就会越接近——“太迟了”。
老实说,我不知道这篇文章怎么收尾。我今天在这里说得太多了。因为这篇文章花了我6年时间。请包涵我言语冒犯之处,包涵我可能误解了一些产品,团队,或某个人。也许我们真的在开始做了很多平台方面的东西,只是我没看到。我只想说声对不起。
但是,我们现在开始必需把事做对了!