3月17日,GTC 2019来了,英伟达CEO黄仁勋的主题演讲放在了北京时间3月19日的上午5:00。还是熟悉的皮夹克,还是熟悉的黄教主。与往年有些不同的是,英伟达此次是带着“翻身”的必胜决心来的,最新发布的GPU架构“安培”(Ampere),或将成为英伟达翻身的关键。InfoQ也对本次大会进行了详尽报道。
2018年GTC China大会前夕,英伟达惊爆股价遭受“腰斩”。与此同时,2018年发布的高端显卡 RTX 2080 Ti 出现花屏问题,导致不少用户对于英伟达的新品质量产生质疑,股价一跌再跌。
GTC 2019之前,英伟达花费69亿美元巨款收购了专门从事数据中心和高性能计算的光互连技术的以色列公司Mellanox,那时就有专家表示:英伟达扭转颓势的机会到了。
北京时间5:05,发布会正式开始。
黄老板一开场就激动地说,有太多想要告诉大家的,当然套路是不变的,秀肌肉是必须的。
作为图像处理芯片起家的企业,首先当然还是要谈谈英伟达在图像处理领域的进展。
随着企业转向人工智能与深度学习、机器学习和数据分析,为了应对强度越来越大的计算需求,英伟达推出了CUDA-X AI,旨在加速数据科学工作负载,使数据更有用。
据介绍,CUDA-X AI解锁了NVIDIA Tensor Core GPU的灵活性,能够将机器学习和数据科学工作负载加速多达50倍,由十几个专用加速库组成。这些库一起加速了典型AI工作流程的每一步,无论是使用深度学习来训练语音和图像识别系统,还是数据分析来评估抵押贷款组合的风险状况,这些工作流程中的每个步骤都需要处理大量数据,每个步骤都受益于GPU加速计算。
之后,黄老板正式开始图像性能的展示。
首先秀出的是RTX强大的画面处理能力。下面两张图中,左侧为真实的汽车图片,而右侧则是由RTX渲染之后的虚拟图像,足以乱真的处理能力,不得不令人惊叹。
和去年的套路一样,为了凸显RTX的计算能力,黄老板疯狂演示有RTX和没有RTX的画面有什么区别。
之后,黄仁勋发布OMNIVERSE,这是一个用于多工具工作流程的开放式交互式3D设计协作平台。
Omniverse包括门户(双向通道),可以维护行业标准应用程序(如Autodesk Maya、Adobe Photoshop和Epic Games的虚幻引擎)之间的实时连接。
这个新的开放式协作平台简化了跨行业的2D和3D产品管道。Omniverse是围绕最新的设计协作行业标准而构建的。它支持Pixar的通用场景描述技术,用于在多个应用程序之间交换有关建模、着色、动画、灯光、视觉效果和渲染的信息,还可以支持NVIDIA的材料定义语言,允许设计者跨多个工具交换有关表面材料的信息。
此外,为了满足数据中心和云图形应用不断增长的需求,英伟达发布RTX SERVER POD。
从好莱坞电影公司对于电影画面不断增长的需求,到对5G、云游戏和VR流媒体的新兴需求,各行各业对计算能力的需求从未像现在这么大。
以前,运行功能强大到能够实时提供丰富的视觉内容的服务器是非常昂贵的,但是现在,情况变了。
黄仁勋在现场发布了RTX服务器,它包括完全优化的软件栈用于Optix RTX渲染、游戏、虚拟现实和基于“增大化现实”技术,专业的可视化应用程序,现在可以提供电影质量的图形增强效果,射线追踪的成本远远低于电力CPU-based呈现相同集群性能的成本。
黄仁勋认为:数据科学是计算机科学领域变化最快的领域。
的确,随着人工智能时代的来临,数据早已不是计算机领域独占的资源,几乎所有行业都在努力与数据科学以及AI接轨,因此,数据资源也显得愈发重要。
无论是推进科学,建立自动驾驶汽车还是从大量数据中收集业务洞察力,数据科学家,研究人员和开发人员都需要强大的GPU计算能力。他们还需要合适的软件工具。
NVIDIA扩展了NGC软件中心,为数据科学家提供了更快地构建优化解决方案的工具,NGC的新模型注册表为数据科学家和研究人员提供了最流行的AI模型库,为他们提供了重新训练、基准测试和快速构建AI应用程序的起点。NGC企业帐户持有者还可以通过托管私有注册表在其组织和团队中上传,共享和版本化自己的模型。
NGC还提供模型训练脚本,其最佳实践利用NVIDIA Tensor内核提供的混合精度,使NVIDIA Turing和Volta GPU在前几代培训和推理中提供高达3倍的性能加速。通过提供经过精确度和融合测试的模型和培训脚本,NGC为用户提供了最重要的NVIDIA深度学习资产的集中和管理。
数据从根本上改变了公司的业务方式,推动了对数据科学家的需求,并增加了工作流程的复杂性。英伟达为数据从业者打造了一套专业的工作站,由领先的工作站提供商构建,将Quadro RTX GPU的强大功能与加速的CUDA-X AI数据科学软件相结合,为数据科学提供新一代完全集成的工作站。
通过Quadro RTX GPU驱动的工作站,从业者可以将RTX的强大功能带入数据科学工作流程。获得高达96 GB的超快速本地内存,以处理最大的数据集和计算密集型工作负载。使用Quadro RTX,使用者可以最大限度地提高工作效率,缩短洞察时间并降低数据科学项目的成本,并建立工作站以确保最高级别的兼容性、支持和可靠性。
NVIDIA驱动的数据科学工作站配备了一整套经过测试和优化的数据科学软件,建立在NVIDIA CUDA-X AI之上。该堆栈具有RAPIDS数据处理和机器学习库,NVIDIA优化的TensorFlow,PyTorch,Caffe 和 其他领先的数据科学软件,为企业提供加速工作流程,以加快数据准备,模型培训和数据可视化。
黄仁勋在演讲中表达了对自动化机器人发展的惊叹,机器人早已不是科幻电影中的幻想,机器人早已深入人们生活的方方面面,而人工智能技术是支撑自动化机器人发展的关键。
随后,黄仁勋掏出一块非常小的线路板,正式发布Jetson Nano,一款人工智能计算机,据称,这款设备可以创建数百万个智能系统。
Jetson Nano支持高分辨率传感器,可以并行处理多个传感器,并可在每个传感器流上运行多个现代神经网络。它还支持许多流行的AI框架,使开发人员可以轻松地将他们喜欢的模型和框架集成到产品中。
Jetson Nano的主要参数包括:
GPU:基于128核NVIDIA Maxwell?架构的GPU
CPU:四核ARM?A57
视频:4K @ 30 fps(H.264 / H.265)/ 4K @ 60 fps(H.264 / H.265)编码和解码
相机:MIPI CSI-2 DPHY通道,12x(模块)和1x(开发人员套件)
内存:4 GB 64位LPDDR4; 25.6千兆字节/秒
连接:千兆以太网
操作系统支持:适用于Tegra?的Linux
模块尺寸:70mm x 45mm
开发者套件尺寸:100mm x 80mm
售价方面,Jetson Nano有两个版本:面向开发人员、制造商和发烧友的99美元开发套件以及面向希望创建大众市场边缘系统的129美元版本。
之后,黄仁勋发布了NVIDIA Isaac SDK,这是一套为开发人员提供Isaac应用程序的工具包,包含Gems(机器人功能)、机器人引擎和Sim的访问。它将为制造商、研究人员和初创公司节省数百小时的研发时间,使其更容易为感知、导航和操作添加AI到下一代机器人中。
其核心是Isaac Robot Engine,它使开发人员能够构建易于部署到Jetson平台的模块化和高速机器人应用程序。还有20多个GEM,为导航和感知算法等硬机器人问题提供即插即用功能。(GEM是为NVIDIA Jetson AGX平台构建和优化的基本机器人算法模块。)
在自动驾驶领域,黄仁勋介绍到:目前英伟达的技术已经深入到无人车制造到路测的各个阶段,不论是地图重建、模拟测试,还是传感器升级,都有英伟达的技术支持。
随后,黄仁勋正式发布Level 2+ 的自动驾驶解决方案 NVIDIA DRIVE AP2X。
NVIDIA DRIVE AP2X 是一套包括 DRIVE AutoPilot 自动驾驶软件、 DRIVE AGX 自动驾驶平台以及 DRIVE 验证工具的解决方案,通过 NVIDIA Xavier 执行DRIVE AV 自动驾驶与 DRIVE IX 智能驾驶仓等功能,为驾驶辅助提供包括车队车、车对路,以及车对人等安全辅助。
同时,黄仁勋表示英伟达将在下一季推出全新的 DRIVE AP2X 9.0,包括更深度的神经网络、人脸识别以及更多类型传感器的支援,其中也将导入用于识别车路与地标的 MapNet ,以强化车路协同机能;此外,新版本还会加入 ClearSightNet ,可使摄像头在强光环境下,或是受到极端天气干扰时,通过如传感器强制清洁等方式清理阻碍。
2018年对英伟达确实不太友好。
8月亮相的高端显卡系列:GeForce RTX 2080,RTX 2080 Ti,和 RTX 2070虽然在发布之初赚足了吆喝,但是RTX 2080 Ti出现的花屏问题却让英伟达不得不为产品质量道歉并提供后续服务。
2018年11月16日,英伟达第三季度财报显示:该营收 31.8 亿美元,非 GAPP 每股摊薄收益为 1.84 美元,均低于分析师预期。11月21日,英伟达股价再受重挫,收跌 12%,两日暴跌超 28%,市值已不足 900 亿美元,自 10 月的高位已经腰斩。
2019年2月,英伟达发布截至1月27日的2019财年第四财季及全年财报,报告显示,英伟达第四财季营收为22.05亿美元,比去年同期的29.11亿美元下滑24%;净利润为5.67亿美元,比去年同期的11.18亿美元下滑49%。
从这一组数据中,我们看到的尽是“下滑”、“下跌”等等字眼,不难看出,英伟达的2018年过的实在有些艰难,甚至在2018年底的GTC China上,黄老板直接取消了媒体提问环节。
受到去年加密货币热潮退散的影响,英伟达的芯片出现了积压的情况,旧产品难以销售,新产品质量又出现问题。不过,黄仁勋很快就意识到问题的所在,他在财报发布后的电话会议上非常简单地说:“世界需要更多的计算。”
正是这句话,令业内人士重新对英伟达燃起信心。
美国财经网站CNBC股评人Jim Cramer表示:投资者可以相信,英伟达在发布业绩报告后股价已经触底,虽然加密货币挖掘市场的繁荣不会卷土重来,但是市场即将正常化,首先是在游戏领域,然后是数据中心。
人工智能、深度学习依旧需要大量的算力,所以这一领域的红利依旧在增长,英伟达仍然被需要。此外,随着英伟达的GPU与Mellanox的互连相结合,数据中心工作负载将在整个计算,网络和存储堆栈中进行优化,并能实现更高的性能,更高的利用率和更低的运营成本,未来,英伟达与Mellanox或许会在AI领域创造出更多的价值。
早在本次发布会前夕,有关英伟达7nm制程的下一代“安培”(Ampere)GPU 架构的猜测就已经遍布全网,去年年底的GTC China大家没有看到新品,所以对于这次的GTC大会,所有人都显得格外激动。
可是…
没想到这浓眉大眼的黄仁勋也学会涮人了…
传说中的安培架构并没有出现。
更多内容,请关注AI前线!