黄仁勋口述:英伟达的发展之道和星辰大海

黄仁勋口述:英伟达的发展之道和星辰大海_第1张图片

来源|wandb.ai

翻译|刘畅

线上对话还未进入后半程,黄仁勋表示自己有点犯困。早前,当天凌晨三点钟,这位英伟达CEO就起床看书了,这个时间确实有点早,看起来在白天也没能补充一些休息时间。即便如此,在机器学习节目《Gradient Dissent》的近一个小时访谈中,谈及AI、全宇宙等新技术,以及回顾英伟达所做的那些大事时,“兴奋”是他的高频词,说了至少十次。

从进军深度学习的背后故事出发,他总结了英伟达所做的三件大事,并且分享了过去几十年里积累的管理经验,还介绍了为什么需要一个遵循物理定律的虚拟世界,以便将AI带入下一个时代,而这也是他们构建全宇宙(Omniverse)的原因。此外,他还分析了关于量子计算、奇点以及MLOPs重要性的见解。

在本次访谈中,他主要表达了这些观点:

  • 开发者不应该老是担心软件在芯片上能不能跑,在各种业务负载上要一直能跑。

  • 人工智能是已经出现的最强大的技术力量,它的好处之一是使计算机科学平民化。

  • 我一直倾向于直接和团队沟通,这样做更透明,所有人都能获取到第一手信息和知识,而不是我的想法被转述、重复和解释。

  • 每家公司都应该知道,未来的软件开发有点像炼丹,这是一个MLOps的过程。

  • 虚拟世界将会有更多的创新、设计和创造力,而不是在物理世界中进行所有的创新和设计。

  • 在未来10年里,不一定是在晶体管层面,在计算层面我们绝对会看到更大的进步。

  • 最有价值的不是智能。归根结底,有价值的是技能。

  • 如果人工智能要进入下一个阶段,就必须学习物理定律。

以下是完整对话内容,OneFlow社区做了不改变原意的编译。

1

进军深度学习的契机与思考

Lukas:我发现,现在几乎所有训练机器学习模型的人都使用NVIDIA显卡,你是从何时开始思考要支持机器学习的,又是如何做的?

Jensen:最开始的时候,有三个不同的研究团队几乎同时联系我们,要求帮助加速他们的神经网络模型,他们都试图参加ImageNet竞赛。2012年,AlexNet的横空出世打破了计算机视觉研究的现状,而之前许多人都是使用NVIDIA显卡和手工设计的特征来做同样的事情,这一巨大突破引起了我们的注意,让我们开始有进军深度学习的意识。

当我们意识到可以不用写软件,不用手工去设计或者创建特征,而是以某种方式自动从数据中识别模式、关系,或者从一些预测模型的表征中学习,我们开始思考,这对计算机视觉乃至软件的整体实现意味着什么?

早期的调研结果让我们提出了一些问题:这会如何影响软件的未来?如何影响计算机科学的未来?如何影响计算的未来?如果你编写软件的方式不同,那么它将如何改变设计计算机的方式?如果所编写的软件是由计算机编写,而不是由人编写,这又将如何影响设计计算机的类型?

我们思考了神经网络对整个计算机科学领域和整个工业领域的影响,问自己,这对一切的发生意味着什么。这最终衍生出一个问题:这将对所有不同的行业有什么影响。

Lukas:最了不起的是,英伟达一直在市场上保持着领先优势,你们做对了什么?

Jensen:部分原因是我们一直深耕在加速计算领域。从我们公司成立以来所有新的特定领域的应用加速方式,计算机图形就是其中之一,还有科学计算和物理模拟,还包括图像处理,你可能认为深度学习也是另一回事。总之,在这些不同的应用领域,我们的最初使命是做加速计算。

为了做特定领域的加速计算,你必须是一家全栈公司,必须理解什么是应用,以及你试图加速的应用的性质。你必须重新设计算法,因为你为串行处理编写的开发算法方式与并行处理完全不同。此外,你必须以不同的方式思考软件和系统,必须以不同的方式思考芯片架构,因为工作负载改变了瓶颈(bottlenecks)所在。

我们很幸运是一家全栈公司,一直致力于算法研究,掌握了从计算机图形到图像再到科学计算所需的技能,这才是一家加速计算公司真正所需要的。而当深度学习出现时,我们就非常擅长解决这个问题。

Lukas:游戏玩家、加密矿工、科学家和算法工程师之间是否存在很大的需求冲突?你们如何把这些人的不同需求沉淀到一个芯片中?不同需求的优先级如何衡量?抑或根本没有冲突,它们需求本质上可能是类似的。

Jensen:绝对有冲突。例如科学计算中,由于有大量的历史代码,可能采用FP64(GPU的浮点计算能力),对于消费类应用程序,FP32就可以了,而对于深度学习来说,有大量不同类型的格式可以使用。

处理时的性质可能会有所不同。有时计算非常密集,有时是更稀疏的计算。例如,光线跟踪的计算非常稀疏,而光栅化(Rasterization)和图像处理的计算相当密集。有不同的计算性质,必须支持不同的精度。每个行业都有大量正在使用的应用程序,你希望支持这些应用程序并能够加速它们。

我们构建了一个通用的GPU,当开发架构时,所有这些应用程序都可以在任何GPU上运行。唯一的问题是,这个运行的处理器更适合于科学计算还是机器学习,还是更适合于成像或计算机图形。

我们为不同的应用程序、不同的市场调整了功能的规模。以GeForce为例,它的fp64计算单元就少一些,fp64类型的计算就不快,就深度学习芯片而言,它可以运行计算机图形,但运行效果不如GeForce。然后再结合上面的软件栈,应该能为用户带来最好的产品。

除此之外,我们真的相信,开发者应该拥有尽可能大的安装基数,所以要尽可能通用,而不是太专用,只满足一个特定群体的需求。开发者不应该老是担心软件在芯片上能不能跑,在各种业务负载上都要一直能跑。

Lukas:最初,人们认为英伟达是为游戏玩家服务的,你是个游戏玩家吗?

Jensen:我没玩过多少游戏。但因为我们与世界上几乎每一家游戏公司都有合作,所以当我知道他们在实验室的时候,我会跑过去看看,玩一会儿。最近我玩过的最喜欢的游戏是《战地(Battlefield)》,我跟我的两个孩子玩过,这可能是我有过的最有趣的记忆。

2

英伟达所做的三件大事

Lukas:你是否担心随着计算在科学进步中变得越来越重要,它会对气候产生影响,甚至拥有计算资源的大小会影响到谁能够做出科学发现,或者创立下一个真正令人感到兴奋的公司?

Jensen:首先,我们对这个行业最大的贡献之一是实现了科学计算的平民化。因为有了NVIDIA GPU,研究人员使用一个GeForce卡就可以做出AlexNet这样的突破,而不需要依靠云计算中的一台超级计算机。

与此同时,世界各地的研究人员购买了GeForce GPU,他们不需要申请巨额资金就能进行研究。因为在架构上,这和我们正在建造的超级计算机都是一样的,所以它们能利用这一点来发现我们今天都在享受的新技术突破。同样的事情也发生在许多不同的领域。

一位从事量子化学的科学家曾对我说,某天他从在硅谷一家计算机公司工作的儿子那里得知,他应该去买我们的游戏卡,下载CUDA SDK,把他在IBM超级计算机上运行的量子化学软件移植到我们的游戏GPU上。

他对显卡的速度十分惊讶,但他不得不在那周剩下的时间里等待超级计算机完成计算,这样他就可以比较结果了,最终,游戏卡和超级计算机的结果都是一样的。然后他去买了尽可能多的GPU,为自己定制了一个自制的超级计算机。他对我说,“因为你的工作,我能在有生之年完成毕生工作。”在很大程度上,我们为他建造了一台时间机器,能够以一种他无法预见的方式看到未来。

因此,我真的为我们已经将高性能计算的平民化感到自豪。

其次,我们所做的第二件大事是,基于人工智能、预训练模型和迁移学习的思想,我们现在有能力让大公司对智能进行预训练。这几乎就像创造了一群受过良好教育的大学毕业生,他们现在正在走向世界,人们可以适应他们的特殊技能。

在很多方面,我们所做的实际上是降低标准,已经将智能平民化了。我们实现了计算机科学的平民化,使几乎任何人都可以下载预先训练好的模型,并通过对其再训练、调整和迁移其学习能力,为其应用领域发挥超人能力。我认为人工智能是已经出现的最强大的力量,它的好处之一将是使计算机科学平民化。

现在,我们正在进行的最伟大的项目之一是Earth-2,这是一个数字工具。我们将尝试建立模拟地球气候的数字孪生,它是一个多重物理问题,也关乎热动力学、流体动力学、化学、生物学问题以及人类驾驶和经济问题。我们希望通过一个模型来测试当前的缓解策略和适应策略,并模拟我们将用于吸收碳或碳排放的技术是否会在十年、二十年、四十年后产生必要的影响。如果没有深度学习和我们正在做的工作,这些都不可能发生,我甚至不敢想象会这么做。

 3

黄仁勋的企业管理风格

Lukas:在经营公司的几十年里,作为一名领导者,你处理事情的经验发生了哪些变化?

Jensen:在30岁时,我对当一名优秀的CEO一无所知,这些年来我做过很多愚蠢的事情,有很多管理技巧真的很愚蠢,后来我不再使用它们了。

早期,我真的很想让芯片流片。为了激励工程师还设置了“流片奖金”,后来证明这是一个极其愚蠢的想法。原因是,如果工程师们能流片时,这项工作自然就会完成,设置奖金并无必要,因为每个人都在尽力。此外,根据规则,当他们延期时,这就会变成一种消极因素,因为他们再也无法获得奖金。我们可以创造条件来完成伟大的工作,但不能制造这种障碍。

领导者可以向团队灌输很多不同的技能,可以成为好的倾听者为团队消除障碍,可以通过强调问题、招募员工来参与解决方案,可以做各种事情来帮助他们思考优先事项,帮助他们缩小工作范围,并尝试寻找最低可行的产品。

另外,我身边有很多领导者倾向于一对一沟通,但我的个人风格是,如果有什么想说的,我一直倾向于直接和团队沟通,而不是一对一。如果我对某事有特别的异议,我会跟不止一个人沟通。如果我认为部门间合作时应该采取特定的战略或方向,那我会同时告诉所有人。我一直致力于这种沟通方法,这样做更透明,所有人都能获取到第一手信息和知识,而不是我的想法一直被转述、重复和解释。

当然,这种风格也会招致批评。例如,我可能会面对十个人说出一个也许是世界上最愚蠢的想法,这再糟糕不过了。但你需要应对经常会说一些不完美的话的情况,没有人对我要求要十全十美。将近30年后,我已经努力克服了这一点。如果我说了什么蠢话,别揪着我不放,给我一个改变主意的机会。

Lukas:经营一家正在挣扎中的公司,与现在这样股价似乎非常高的有前景的公司,那是一种不同的体验吗?在不同的情况下,你需要做不同的事情进行应对吗?

Jensen:从来没有不同,在我的行为和股价之间不可能找到关联。近30年来,我的行为、处理问题的方式,待人和对待公司或工作的方式都是一致的,那没有任何关联。

给我一点时间的话,我会找各种各样的问题来谈。CEO们的身边都是问题,而不是好消息,但我喜欢解决问题。因此,我将公司的财务成功、工作的重要性以及做有影响力的工作完全分开。我一直都这么做,不管公司好坏。

当我们做得不好的时候,尤其是把赌注押在加速计算上时,我们希望每一块芯片都具有我之前提到的相同架构,我们的财务业绩也面临巨大的压力。但我当时的热情不减,对未来也同样充满信心。

Lukas:你根本感觉不到外界的压力吗,还是你能把压力从中分离出来?

Jensen:作为一家上市公司,你会面临很大的外部压力。一些投资者在表达他们的不满和批评时真的很巧妙,而一些投资者不是那么耐心,这是可以理解的。

但CEO必须理性,我们的工作是解释为什么要做去这件事,必须有做某事的目标。如果我们清楚地表达了做事的原因以及愿景,并且真的相信它,投资者还是愿意给机会去试一下。

当我们刚成立公司时,面向消费者的3D图形并不存在,甚至连API都不存在。但我们必须去宣扬这一点,而且花费的时间比人们想象的要长。当我们进入加速计算领域时,大约15年来它都不存在,起初我还以为只要花2年时间就可以了。

AI也是这样。在最初的5年左右,我没完没了地谈论机器学习和深度学习的重要性。我想人们就是不明白它的好,这是建立新市场和新方法的一部分。你必须认识到,人们需要时间去接受。我认为这个行业对我们很有耐心,员工对我也是如此,我真的很感激。

Lukas:我真的很钦佩你在很长一段时间里管理同一家公司的方式,这并不容易,因为有很多具体事物需要把控。但另一方面,从技术上来说,你似乎总能跟上前沿潮流,并且保持一定的技术深度。你是如何做到这一点的?

Jensen:我认为必须保持学习。当然,我认为部分原因是“能量和好奇心从何而来?”

我的周围都是非常聪明的人,你可以向他们学习,可以结合自己的理解。当你破解一个谜题或者学到一些新东西时,真的会兴奋不已。

我认为,CEO最重要的任务之一,就是创造条件让优秀的人能够完成他们的毕生事业。我非常努力地创造条件让那些了不起的人来到这里,周围都是不可思议的同事。我认为这对了解前沿技术有很大帮助。

另外,CEO真的需要享受公司以及整个行业正在发生的事情,有很多东西需要学习,看看你能否想象出一个对每个人都更好的未来。

 4

为什么MLOps至关重要

Lukas:有这样一个说法,在机器学习中,尤其深度学习项目几乎看不到曙光,它们比传统工程更难管理。当你审视你的客户群体时,哪些最常见的问题会阻止机器学习去真正解决客户的实际问题?

Jensen:这是一个很好的问题。深度学习技术与利用深度学习、机器学习编写软件之间有着根本的区别。方法、过程和工具非常重要,其中很重要的是一个工具是MLops。

你不仅要了解神经网络架构,而且要能够发明出能产生优异结果的东西,这本身就是一项开创性的工作,但为了利用这一点,企业必须意识到这更像是一家智能工厂。以高效的方式管理workflow,是一个相当重要的过程。你有数据,并将数据最终转化为神经网络或其他大规模智能的输出,转化过程很复杂。这也是MLops工具如此受欢迎的原因之一。

这是一种全新的思考计算机科学的方式,现在有了工程师,他们得到了巨型超级计算机的支持,这些超级计算机正在运行你们构建的软件堆栈。整个流程都必须为机器学习、深度学习而重新设计。每家公司都应该知道,未来的软件开发有点像炼丹,这是一个MLOps的过程。

Lukas:你是否觉得机器学习中的某些问题还没有得到充分的探究?

Jensen:我们现在正在进行的一些研究工作,一个是多模态的自我监督学习方法,也有很多聪明人在研究,它将让现在正在建造的平台黯然失色。多模态AI,包括视频、语音和自然语言,这将把感知提升到一个全新水平。我也对Zero-Shot学习很感兴趣,它非常强大,我对此感到非常兴奋。

我认为现在正在探索的领域之一是将图结构映射到深度学习框架或图神经网络中。图基本上是一种可以描述生活中几乎所有有意义的事物的结构,这是它如此有用的缘由。

但是图处理很麻烦。DGL、GNN和Geometric的突破,都是为了将图映射到框架中,深度学习管道的构造,将其置于深度学习如此有效的世界中。我希望有更多的人做这项工作。

最后,我认为虚拟世界将会有更多的创新、设计和创造力,而不是在物理世界中进行所有的创新和设计。人们所说的元宇宙将成为制造、设计、艺术和各种娱乐的全新领域,但还有很多事情要做。

5

量子计算、“超人”AI和奇点

Lukas:你认为根本性的变化正在到来吗?尤其是量子计算什么时候会成为现实?

Jensen:这肯定会发生在我们的有生之年,我们一定会看到的。在许多应用中,无论是药物发现还是大型组合规划和优化(最优路径、旅行商问题),人们一直认为这类问题需要量子计算。但我想强调一下机器学习和深度学习的奇妙之处。

实际上,因为有了机器学习、人工智能,我们在上述领域取得了巨大的飞跃,这不是摩尔定律式的跳跃式进展。如果你看看科学家们的工作,在过去10年里,摩尔定律——如果它以全速运行的话——可能会将性能提高100倍,但是,由于机器学习或深度学习的推动,许多应用的性能提高了1000000倍。

在接下来的10年里,由于加速计算和深度学习的进一步发展所产生的一些创新,以及被称为物理信息神经网络的新领域,我完全期待着我们可以在科学发现的许多领域做一些非常棒的工作,我们可能还会看到另一个1000000倍性能提升的发生。这个级别的提升是很难让人理解的,但我们将在许多不同的领域看到这一点,无论是在医疗保健、气候科学还是其他非常重要的物理学领域。

Lukas:我们会在有生之年见到AGI(通用人工智能)吗?你认为奇点会到来吗?

Jensen:我不知道。如果我们换个角度重新思考这个问题,人工智能会比人类做事更出色吗?事实上,人工智能在很多很多领域已经是“超人”级别了。我认为,很多重复的操作任务,机器人比人类做得更好,比如外科机器人永远不会颤抖,将能够做出最微小、精确的切口。人工智能将在未来十年学习更多的超人类技能,这非同寻常。在未来几年,我们将看到“超人”人工智能,在许多领域,它会非常令人难以置信。

Lukas:我可以想象,会看到人工智能帮助制造芯片和设计更好的芯片。你们可能看到了复利回报,我想这是奇点背后的理论。

Jensen:完全正确。如果没有人工智能,我们就无法制造下一代芯片。今天,我们公司拥有世界500台超级计算机的其中5台机器,正在生产与人工智能芯片中的软件。在未来,如果没有人工智能,我们将无法设计用于运行人工智能的芯片。我完全相信,在未来10年里,不一定是在晶体管层面,但在计算层面我们绝对将看到更大的进步。

6

全宇宙与AI的下一个时代

Lukas:现在真正激励你的是什么?此时此刻,你觉得自己正在服务的目标是什么?

Jensen:我们公司没有使命宣言,但没有人对使命感到困惑。就像“做有影响力的工作”,那需要很长时间才能成功,因为它必须对人们有意义,而且我们是世界上最擅长解决问题的人。

我现在对两个方面感到非常兴奋。一个方面是认识到我们已经发明了智能技术,能应用到感知、语音、语言理解等领域。

然而,最有价值的不是智能。归根结底,有价值的是技能。我们雇佣的新大学毕业生很聪明,但技能却很少,我们通过让他们适应领域来为他们提供相应的技能。

在很多方面,现在缺少的是将智能技术转化为有价值的技能,无论是自动驾驶汽车、客户服务、呼叫中心等宝贵技能,也可以是自动化的技能。我们现在可以创造各种真正有价值的技能,这是我们目前很大一部分的精力投入,如何利用这项使能技术,并将其转化为技能,以便业界的客户、开发人员能够将其应用于各种领域。这就是人工智能的大规模应用。

另一方面是人工智能的下一个时代。我们在云端的软人工智能方面做得非常好,像推荐音乐、推荐电影和购物车商品等应用。如果人工智能要进入下一个阶段,它必须学习物理定律。

无论是气候科学、自动驾驶汽车、制造业还是其他领域,人工智能对世界上的许多挑战不能仅仅做出预测,它必须做出符合物理定律、物质守恒定律、能量守恒定律等的预测。它必须理解同步时间的概念,很多这样的问题真的不可能做到,除非我们有一个遵循物理定律的虚拟世界,否则开发人工智能是不可能的,这就是我们构建Omniverse的原因。

Omniverse是基于物理的,是分布式的,能够支持非常大的模型。它的目标是多方面的。你可以教机器人如何在这种基于物理的环境中成为一个运转良好的机器人。你可以将其连接到物联网系统,例如,循环运行机器人硬件。它能够连接到物理世界并保持同步,这意味着建立了一个数字孪生世界。

数字孪生的概念已经存在了一段时间,但与人工智能结合后,数字孪生将对未来产生深远的影响。我对这些领域感到非常兴奋。

Lukas:听起来你很想让你的公司更接近人工智能应用。

Jensen:我们要做的是为构建应用的人创建一个应用程序框架。在该框架下,我之前在GTC主题演讲中展示过一个叫Jensen的虚拟机器人,也被称为化身(avatar),它用了计算机视觉、语音人工智能等等。

在未来,我们真的需要进入到应用中去体验,无论它是虚拟工厂还是虚拟医院。通过一个叫VR的“虫洞(wormhole)”,我们可以进入那个世界,也可以让那些智能体走出那个世界与我们合作,智能体会通过一个叫AR的“虫洞”出来,出现在现实世界里。

除此之外,人们认为,需要佩戴头戴式显示器进入元宇宙,但这与事实相去甚远。元宇宙将主要在2D显示屏上呈现。

(本文在已获得编译授权,因翻译引入的缪误由译者承担责任。原文:https://wandb.ai/wandb_fc/gradient-dissent/reports/Jensen-Huang-NVIDIA-s-CEO-on-the-Next-Generation-of-AI-and-MLOps--VmlldzoxNTkyNDI1)

其他人都在看

  • OneFlow实习岗位热招

  • 计算机架构的新黄金时代

  • 那些在开源世界顶半边天的女同胞们

  • 一文理解深度学习框架中的InstanceNorm

  • 计算机史最疯狂一幕:“蓝色巨人”奋身一跃

  • 30年做成三家独角兽公司,AI芯片创业的底层逻辑

点击“阅读原文”,欢迎下载体验OneFlow新一代开源深度学习框架

黄仁勋口述:英伟达的发展之道和星辰大海_第2张图片

你可能感兴趣的:(人工智能,大数据,编程语言,python,机器学习)