Nvidia显卡虚拟化(vGPU)信息汇总-20200330

目标:汇总服务器显卡资源信息

时间:2020-03-30

大纲:

一、Nvidia目前支持显卡类型及相关指标介绍 

二、服务器显卡虚拟化CPU选择标准

三、VMware和Citrix显卡HCL查询方法

四、如何和工作站显卡对比选型



主要目的:方便有需求的小伙伴查询确认。第三次强调时间,硬件的更新速度比较快,所以使用时候一定要确定好时间。


一、Nvidia目前支持显卡类型及相关指标介绍 

显卡类型介绍(直接上图):


显卡虚拟化型号汇总

GPU- graphics processing unit 显示核心、视觉处理器、显示芯片或绘图芯片,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上运行绘图运算工作的微处理器。

CUDA(Compute Unified Device Architecture,统一计算架构)  ,是由NVIDIA所推出的一种集成技术,是该公司对于GPGPU的正式名称。透过这个技术,用户可利用NVIDIA的GeForce 8以后的GPU和较新的Quadro GPU进行计算。亦是首次可以利用GPU作为C-编译器的开发环境。CUDA可以兼容OpenCL或者自家的C-编译器。无论是CUDA C-语言或是OpenCL,指令最终都会被驱动程序转换成PTX代码,交由显示核心计算。CUDA是一种由NVIDIA提出的并由其制造的图形处理单元(GPUs)实现的一种并行计算平台及程序设计模型。CUDA给程序开发人员提供直接访问CUDA GPUs中的虚拟指令集和并行计算组件的存储器。

    使用CUDA技术,GPUs可以用来进行通用处理(不仅仅是图形);这种方法被称为GPGPU。与CPUs不同的是,GPUs有着侧重以较慢速度运行大量并发线程的并发流架构,而非快速运行单一线程。

Tensor内核是专门设计的内核,具有比常规CUDA内核更高的深度学习性能。该架构是采用台积电的12 nm FinFET工艺生产的。

Real-Time Ray Tracing AccelerationTuring引入了实时光线追踪,使单个GPU可以渲染视觉逼真的3D具有物理上准确的阴影,反射和折射。 图灵的新RT核加快了射线追踪速度,并被系统和介面(例如NVIDIA的RTX光线追踪技术)和API(例如Microsoft DXR,NVIDIA)OptiX™和Vulkan光线跟踪可提供实时的光线跟踪体验。

GPU scheduling-vHybrid,这是一种轻量级的用户模式运行时框架,其中我们集成了GPU的调度算法和CPU的两种算法,以有效地利用QoS的控制精度来利用CPU资源。

Live Migration- 启用NVIDIA GPU的虚拟环境中的实时迁移使IT人员可以将正在运行的虚拟机从一台物理服务器迁移到另一台物理服务器,而停机时间最少,并且不会丢失数据。 在工作负载迁移期间,用户将继续访问所需的应用程序,并且计算密集型服务器工作负载不会中断。

Multi-vGPU-支持GPU虚拟化

最大支持的VGPU个数可以通过显存/GPU ProfIles ,有个例就是Quadro RTX 8000,显存最大是48G的,但最多支持32个vCPU

例:


vGPU Type

这个文件是GPU的驱动程序里XXX-grid-vgpu-user-guide

GPU驱动的下载地址(点击链接,有把梯子速度快点),但需要注册一般购买产品会发链接给你,当然是可以选择试用了,点击试用

Types:GPU虚拟化显卡,不仅要购买物理显卡还是要购买许可,分三种:GRID Virtaul Apps、GRID Virtaul PC、Quadro Virtual Datacenter Workstation


许可对比

GPU显卡虚拟化兼容性列表:https://www.nvidia.com/en-us/data-center/resources/vgpu-certified-servers/


GPU兼容性列表查询 


tips:链接太多,注意文本的超链接;本文的目的主要是汇总查询,方便小伙伴们,快速确认信息。


二、服务器显卡虚拟化CPU选择标准

对于服务器显卡虚拟化的CPU选择,应以应用为准。

CPU渲染

渲染在渲染时会100%地使用CPU的所有内核。这意味着,如果您仅将工作站用于3D渲染图像和动画,或为此编码视频,则您正在寻找的是带有CPU的计算机,该计算机应具有尽可能多的内核。

3D建模

与渲染相反,3D建模是一个 活跃的工作过程。

您(通常)坐在电脑前,并与3D软件进行交互。

积极地使用软件以完全不同的方式利用其运行的硬件。

举个例子:我正在建模汽车。该汽车由多边形组成,将对其应用了修改器和变形器,例如镜像,克隆,弯曲对象等。

您的计算机必须经过认真的计算才能处理所有这些,但是这里的关键是这些计算 主要仅在SINGLE CPU Core上完成。

对于应用来说,肯定要明确应用的类型,些处不做过移阐述,以相关应用人员为主,项目实际经验的,渲染时,你分给虚拟多面多少CPU,他都能跑满,我们要在速度和资源消耗方面寻索平衡(如matlab);对于3D软件设计来说高主频下效率会更高(Solidworks)


Nvida官方CATIA最佳实践配置


三、VMware和Citrix显卡HCL查询方法

Citrix硬件兼容列表


硬件兼容列表1


硬件兼容列表2

VMware硬件兼容列表


兼容性列表


相关固件版本下载


https://kb.vmware.com/s/article/2030818

四、如何和工作站显卡对比选型

      如果现在已经有工作站何做选型工作(点击查看官方对比)

       个人理解:1、对于可vGPU的显卡而言CUDA CODE和TR code一般情况下远远多于工作站GPU,并且渲染单元共享,可以用CPU超分的逻辑来理解。

                      2、整体设计一般考虑显存上接近和CPU上主频上接近来来对比。考虑使用超融合架构和纯SSD存储;

                       3、前期预估,在POC或上线从小到大测试,选择适合的型号,充分利用资源;


P2000 CUDA单元


P40整体性能


推荐配比1


推荐配比

当然具体的情况和虚拟桌面软件、网络等条件都有相关,请按实际测试情况调整。


你可能感兴趣的:(Nvidia显卡虚拟化(vGPU)信息汇总-20200330)