在极度商业化的今天,科技的进步与企业的名字一定是分不开的。
每当我们想要盘点一下AI时代的幸运儿,“英伟达”绝对会自然而然地第一个出现。
原因可能是,它就像通讯时代的AT&T,计算机时代的Wintel,互联时代的google,和移动时代的苹果一样,在全球范围内统治着自己所在的产业,只要不犯错,就可以吃着技术和时代的红利顺顺当当地过上好几年。
前不久,靠GPU掘到了AI“第一桶金”的英伟达,也迎来了自己的第十个GTC(GPU Technology Conference,即GPU技术峰会)。
这个起源于2009年加州圣何塞的技术会议,最初的重点是通过GPU解决计算挑战的潜力,十年之后的今天,英伟达重新找到了拥抱GPU的理由,以期更安稳地逗留在AI的怀抱。
今天,我们不妨通过GTC的技术蝶变,来了解一下英伟达这位“幸运鹅”的幕后推动力,以及我们每个人在这场技术浪潮中,可能拥有的位置。
(GTC 2019,英伟达创始人、CEO黄仁勋)
透视GTC 2019:
英伟达做起了TO B梦?
作为英伟达最重要的技术输出窗口,每年的GTC都会吸引数万人参加。众多想在AI风口有所斩获的弄潮儿们,都试图第一时间吸一口英伟达的“欧气”。GTC也不负众望,每年的新品都让AI开发者们化身“尖叫鸡”。
比如GTC 2015,NVIDIA发布了地球上最快最强大的单芯游戏卡GeForce GTX Titan X以及DRIVE PX自动驾驶汽车电脑。前者被游戏宅门奉为神话,后者让自动驾驶厂商欢欣鼓舞。
2016年的重头戏也是新卡和新架构,发布了两款超大规模数据中心的加速器Tesla P4&P40还加入了当时大火的VR。也正是在这次会议上,英伟达正式宣称——“我们不再是一个半导体公司,而是一个 AI Computing Company。”
既然自诩为“AI领军者”,那么除了赚钱,自然也要为行业出点力。于是在接下来在2017年GTC大会,我们能看到英伟达开始将重心逐渐转移到了开发者支持和生态建设上。当年,就发布了一款支持所有框架的可编程 AI 推理加速器NVIDIA TENSORRT3,以及全球首款自主机器处理器Xavier。
从这个时候开始,GTC的画风就有些变了。从性感的技术会议,变成了“生态孵化中心”和“带货专场”,也不过两年多的时间。
GTC 2018就被评为“缺乏创新”。观众们没能在这场峰会上看到万众期待的新硬件设备和革命性显卡,倒是“便宜大碗”的TESLA T4一再被强调,现场演示了TESLA T4容器化运行AI任务的多种效果,仿佛是一次“库存招商会”。还没几个月前在图形学会议SIGGRAPH上推出的“Turing(图灵)”架构和Quadro RTX专业显卡惊艳呢。
今年按照咱们中式思维,十周年这么重要的日子,怎么也得发布点逆天神器找回排面吧?结果“老铁,要卡么”的故事又一次上演了。在刚刚结束的GTC 2019,英伟达依然选择了“灭嗨”的产品矩阵——没有炫技,没有欢呼,只有稳定可靠便宜的企业级硬件。
核心的三款产品:“RTX SERVER”,实际上就是在一个8U的机箱内塞进了40张T4加速卡,针对大规模的图形渲染需求,甚至能够作为云游戏的云端处理节点。
“Data Science Server(数据科学服务器)”,采用了两套英特尔顶级平台带4张英伟达T4加速卡的结构,提供260TFlops的半浮点运算能力。
针对自动驾驶的全新虚拟运算平台“DRIVE CONSTELLATION(DRIVE 星座)”,一层是英伟达现有的自动驾驶运算平台,一层是有8张T4加速卡的机箱,是用来负责生成虚拟逼真环境的。
众所周知,TESLA家族中的“4”系列向来都是极为高效的企业级产品,具有比较强的性价比。显然,这就是个由T4构成的面向企业级应用的排列组合,个人粉丝们还是洗洗睡吧。
放弃C端拥抱B端,成了本届GTC的潜台词,也清晰地展示了英伟达的态度——不能变现的技术都是耍流氓。对此,我们很难简单粗暴地下一个结论,质疑它的创新能力。毕竟在技术的进化历程中,大企业的战略选择往往展现着当下的关键问题。
我们更想了解的是,英伟达真的到了不得不转型的节点吗?它的变化又会给这次AI技术浪潮带来哪些影响?
好风凭借力:从“游戏宅”到
“AI霸主”的角色变幻
想要看懂英伟达的未来,或许有必要先梳理一下,它是怎样一步步走到今天的。
简单起见,我们将英伟达的发展通过两个关键的时间转折点串联起来。一个是从游戏到AI的时来运转,这造就了它两年八倍的增长神话;第二个是从制造到产业的身份更迭,这决定了它未来的加速度。
转折一:从游戏到AI的弄潮儿
作为一家1993年成立的芯片公司,直到2012年前后漫长的一段时间里,英伟达最为人熟知的角色,还是游戏宅们的“钱包绞肉机”。
1993年,时任Coreware主管的黄延勋和来自太阳微电子的工程师克里斯·马拉考斯基,以及图形芯片设计师柯蒂斯·普里姆,一拍即合地认为,下一波计算的正确方向将是基于图形加速的。这种模式可以解决通用计算根本无法解决的问题,其中,电子游戏是最具挑战性的计算问题,也是最有“钱”景的方向,于是只用了4万美元,英伟达就开张了。
此后,英伟达的GPU就一直在和Intel、AMD等老牌CPU暗搓搓地抢份额。直到1998年RIVA TNT的发布,高超的图形渲染能力一举奠定了英伟达在GPU领域的声誉。第二年,GeForce 256(Nv 10)在车载技术中的图像加速表现大大超过了市面上的所有产品,并开始拿下了大笔大笔的硬件订单。微软的Xbox游戏主机,更是直接打给了NVIDIA两亿美元的预付款。2004年,英伟达还协助索尼设计了PlayStation 3游戏控制台。
此后的数年里,英伟达收购了不少图形领域的公司,以加强自己在游戏渲染硬件上的优势。毫不夸张地说,这期间的英伟达只有两个对手,一个是它自己,能否不断让粉丝发出“鹅妹子嘤”的尖叫;一个是美国法律,2006年,英伟达就被美国司法部调查了关于可能反垄断GPU行业的违规行为。
不过尽管如此,英伟达的业绩增长依然是渐进式的。比起科技公司的指数型增长曲线,它表现得更像一个传统的制造公司。既然如此,那么它也必然要面临生产型企业的难题——故障率。
2008年,英伟达的收入出现了大幅衰减,第二季度比第一季度减少了有2亿美元之多。原因是其生产的移动芯片组和GPU显卡由于制造缺陷出现了极高的“异常故障率”。因此,它也成为苹果、戴尔、惠普等公司集体诉讼的对象。问题直到2010年才得以解决(英伟达向所有笔电用户补偿了修理和更换费用)。
这样的尴尬状况一直持续到了2012年前后,也就是英伟达企业生涯的第一个关键转折点——人工智能!
2012年,黄仁勋发现自家GPU性能适用于人工智能场景,英伟达就开始通过一系列手段支持人工智能技术的发展,比如打造性能、架构更加高效的GPU,即“通用AI处理器”。
不过,连它自己都没有预测到,GPU会成为AI产业端“算力”的最关键、无可取代的代名词。
在2012年的ImageNet大赛中,多伦多大学的深度卷积神经网络架构,使用两个GPU实现了准确率10.8% 的大幅提升,惊艳AI界。于是到了2013年,所有参赛者都采用了深度学习算法,也都跑在英伟达的GPU和CUDA上。
在这样的大形势下,英伟达打造的针对各种人工智能训练和应用场景的GPU解决方案,很快成为研究机构和开发者的首选。
无论是打败世界冠军的AlphaGo背后的谷歌,还是中国BAT的人工智能技术,都在使用英伟达提供的芯片组进行工作。
“吃鸡”(绝地求生)等高端游戏的出现,自动驾驶研发热潮的兴起,区块链虚拟币的疯狂涨幅,都成为英伟达“一飞冲天”的助推力。
由于技术的独占性,人人都想用英伟达的GPU,直接也让其出货量涨到了惊人的程度,连带成为了2013-2017年全世界表现最好的大盘股,连谷歌脸书都要避其锋芒!
收获AI果实的那几年,是英伟达名副其实的高光时刻。2015年,英伟达的股价只有20美元,到了2017年,已经突破了160美元。这才是我们熟悉的科技独角兽才拥有的性感曲线嘛!也是在这个阶段,黄仁勋才能在GTC上自信地说出“我们不是硬件公司,我们是AI公司”这样的话。
总结一下英伟达的第一次命运转折,核心原因就是在整个AI产业链中,作为处理器制造商的英伟达处在了一个不可替代的地位,崛起也就成为历史的必然。
时势造英雄:
从霸主到生态的江湖风云
时势造英雄,也能磨灭历史的赠予。巅峰之际的英伟达,高光背后的身影反而略显狼狈。
从GTC的变化,细心的旁友们可能就已经有所察觉,一方面,英伟达的“清库存”压力越来越大。
成也挖矿,败也挖矿。伴随着区块链的大跳水,量价齐飞的英伟达GPU芯片也面临着需求骤降的危机。
个人电脑端的显卡升级需求来到了瓶颈期,自动驾驶业务的增速也开始停滞,重重催逼之下,英伟达的营收几乎下降了40%。经销商和零售商渠道的GPU库存估计且得消耗一点时间。为了卖卡,英伟达甚至还颁布了丧心病狂的“显卡禁令”,不允许使用(便宜的)GeForce和Titan芯片来跑深度学习了,变相逼迫开发者和学术界购买更昂贵(大概十倍左右)的Tesla系列GPU。
这也是为什么,连最应该秀肌肉的GTC都无心搞创新(噱头),只专心带货了。
另一个变化,则是越来越扎实的产业AI布局。
往年英伟达也多次强调平台化能力、开发生态、解决方案这些东西,比如2017年和百度包括云计算、自动驾驶、消费设备和开源框架PaddlePaddle等领域达成深度合作伙伴关系等。但看起来都比较“形而上”,更像是一种卖显卡的公关策略。
反观这两年,其为产业端赋能的动作开始越来越有力,而且是真金白银地“用钱投票”。
2018年9月,英伟达开放了CUDA 10工具包的下载,12月初宣布开源物理模拟引擎PhysX的SDK,显然是吸引和鼓励更多的AI开发者加入。
紧接着又推出了一款更适合深度学习的GPUTitan RTX,增强其数据中心产品的功能,争取更多AI伙伴的信任。前不久,还分享了全新的人工智能CUDA-X生态系统,能够容纳人工智能架构、云端机器学习服务、实际落地部署、工作站、服务器、云服务等多种参与者的需求。
(英伟达支持的人工智能系统,能够利用城市里超过十亿个摄像头来帮助管理交通拥堵)
不难发现,原本产业解决能力只是英伟达发布会上的“锦上添花”,但通过两年里的各种布局,已经成为可以真实撑起英伟达未来的关键性力量。
这种从硬件制造到产业生态者的身份转折,表面上看起来是管理者一统江湖的高瞻远瞩,不过仅仅将此归功于企业的主动变革,显然不够客观。还应该看到的是,英伟达所处的气温带,也不再那么舒适了:
首先,区块链市场一落千丈,矿卡和显卡变得越来越不好卖了,连带着英伟达的股价甚至一度跌掉了最高值的一半,靠什么维持资本市场的预期是它必须考虑的问题。
其次,越来越多的科技企业和传统CPU厂商开始切入芯片赛道,对英伟达的市场份额虎视眈眈。其中不仅有谷歌、苹果这样的技术巨头,很容易凭借技术优势在硬件领域崛起;还有Intel、AMD这样的老牌对家,不断推出更便宜的替代品。
谷歌研究院院长、美国“人工智能”教科书的作者彼得·诺威格博士,有一句广为流传的话:当一个公司的市场份额超过50%以后,就必须去挖掘新的成长点了。这正是当下英伟达所面临的“甜蜜的压力”。
一方面,它必须靠扎实的产业支撑来保护现有的城池,另一方面,作为上市公司它总是需要有尽可能多的收入来源以证明自己的未来。
换句话说,产业AI的to B梦,英伟达不得不做。
失之东隅收之桑榆:时代宠儿英伟达
说了这么多,或许我们可以比较清晰地看清楚,AI的浪潮是如何将英伟达推上了商业的前沿。那么它是否还有能力来领导接下来的产业端智能革命呢?
作为目前AI芯片领域的王者,我们可以简单总结一下英伟达在产业AI领域的优势所在:
1.软硬件的兼容性。英伟达的软件生态和硬件性能,可以说是目前最成熟的。很多做前沿研究的人,都会把实验和开发放在英伟达的硬件和平台上。尤其是一些自动驾驶厂商,即便有新的芯片推出,他们不愿意轻易尝试或是去更换英伟达的产品,因为它代表着久经考验的稳定性和软硬件协同优势。
2.规模化优势。得益于坚持不懈地卖货,英伟达在产业AI的所需要的处理器芯片、架构和解决方案上,无论是研发投入还是制造规模上,竞争对手都要略逊一筹。这种优秀性能效率比,短期内还难以被超越。
3.产业端的前期沉淀。
在十几年前,英伟达就尝试通过GPU来帮助一些石油、气象和生命科学领域的客户。比如曾经和浪潮一起,帮助中石油将勘探软件应用迁移到GPU上。用十几台GPU服务器替代了原来的一两百台CPU服务器。
作为GPU生态从无到有的创造者,英伟达在产业端的部署经验和工程能力,也是其他竞争对手所不具备的。
同时,英伟达也没有放弃在技术创新上的领先性。它每年都会为 AI 推出一种新的架构,虽然GTC 2019乏善足陈,但今年可能还是会推出业内首个7nm 解决方案,直接拉开与竞争对手的差距。
总而言之,英伟达切入B端市场,虽然是一种半自愿半无奈的选择,但也有着深厚的积累与护城河。虽不至于“高枕无忧”,但绝不是“黔驴技穷”。
重走AI路:英伟达的“王座”如何稳固
在英伟达的AI登顶之路上,Intel就是一块尽职尽责的垫脚石。
在2017年的GTC China上,英伟达的掌门人黄仁勋就凭借“摩尔定律已死”而被媒体大肆报道(还有人不知道摩尔定律是Intel创始人戈登-摩尔博士提出的吗?),原因是CPU的增长幅度大幅缩小。导致一段时间里,“Intel吐血,GPU牛逼”成了坊间热议的话题。
不过,仅仅两年时间,我们就看到当年Intel的窘境,也开始成为英伟达的梦魇。
虽然雄霸了AI芯片市场,但它的远景并不容乐观。即使占据全部份额(这显然不可能),它也很难使公司再以指数级的速度成长。而且,由于反摩尔定律的作用,它的营业额也并不会因为多卖了一些设备而成比例地提升(它也卖不出去以前那么多了)。换句话说,如果不尽快开拓出新的市场,就会面临Intel在AI时代同样的尴尬。
让人不由感慨,英伟达凭借深度学习的鹊起,顺利从一个硬件公司转型为科技企业,却发现这个新身份是如此地容易早熟,没过几年就成长到了饱和状态,不得不再去寻求新的定位。
但有时候,找到一个新的商业模型比等待一次技术浪潮的红利更难。
我们可以随手举出几个尚待解决的难题:
比如B端的商业化。
B端的商业模式是靠大投入大批量来挣钱,厂商往往需要花几倍于其他公司的经费来开发一款芯片,才能够在同一代芯片中胜出。目前看来,英伟达的产业AI解决方案就是对同一款芯片的排列组合,但深入到更加垂直的细分领域时,就很难做到凭借一款产品的规模化来盈利。
而且,极大运算量的机器学习正在越来越多地引起了市场的反抗(缺乏应用场景、训练成本过高、低资源学习兴起等等),坦率来讲GPU并不是一个最好的解决方案,市场还一直三心二意地等待着更具性价比的技术,比如ASIC。从长远来看,AI将越来越少依赖于CUDA和GPU。
我们都知道将有新的计算加速技术出现,并且都肯定一点,虽然不知道那个新技术会是什么,但肯定不是更多更快更强的GPU。
从这个角度来看,英伟达有点像“芯片界的杨超越”。人人都认为它能在AI时代C位出道,是靠运气打赢的。它自己也很清楚地知道,如果不找到新的成长点,它就会随着时代红利的过去而活成前辈们“糊”的样子。
英伟达对世界最大的贡献在于,它为深度神经网络找到了一个最为现实的舞台,直接地让AI得以可知可感可用,说它是过去几年中AI大潮中最成功的一个也毫不为过。
同时我们也应该庆幸,有越来越多的竞争对手走入战场,让英伟达保持着一份“王者”难得的忐忑和惊惶。六个月让显卡性能提升十倍,相信没有诸多竞争对手的话,它是做不到这一点的。
“秦有六国,兢兢以强;六国既除,訑訑乃亡”。这条规律对于AI江湖和英伟达,也同样适用。