在经历了近10年的发展之后,专业图形卡已经非常成熟。在我们以往测试过的所有专业图形卡中都展示了许多一致的特性。对于新一代专业图形卡我们认为它们必须具备以下特性,才能满足我们不断提升的需求。
基于PCI Express Graphic(X16)接口
尽管使用PCI Express Graphic(X16,以下简称PEG)接口的娱乐用图形卡对比相同型号的AGP图形卡在性能上的优势微弱,但这并不代表PEG接口所提供的性能仅稍好于AGP 8X。在绝大部分游戏应用中所需要调用的纹理容量基本很少超过256MB。而在专业应用中,所需要的纹理却经常突破1GB。要高效的对这些纹理进行操作,显然需要1GB以上的显存,可惜的是如此大量显存的显卡价格将会惊人的昂贵。于是将纹理存储在系统内存中会是一个折中的办法,要高效的调用系统内存中的纹理,显然需要高速的接口,此时PEG接口的性能表现绝对超乎你的想象。
完善的I/O接口
Dual DVI-I接口是专业图形卡必然的选择。DVI-I接口的好处是你可以根据需要使用转换头而将他们轻易的变成D-Sub输出,但是如果你仅仅只有1个DVI-I和1个D-sub输出,在连接DVI设备时将会遇到极大的限制。与此同时,图形卡所能提供的最大输出分辨率也需要特别注意。许多设计师喜欢使用22寸甚至更大的显示器,这些显示器的分辨率有1920x1200甚至更高,图形卡能否在如此高分辨率情况下提供清晰稳定的输出和所需刷新率也需要特别关注。
除了视频输出外,集群多屏渲染用户还需要GenLock接口和FrameLock接口以保证所有系统刷新率上同步,从而保证渲染、演示结果的正确。而要求更高的用户恐怕还需要SDI接口直接输出未压缩的SD/HD视频信号和立体眼镜接口。在选购专业图形卡时,我们必须要清楚的了解所需端口。
小知识:
什么GenLock、FrameLock?
Genlock(Generator Lock)其实就是提供该显卡刷新率信号的端口。在多个显卡/系统连接进行共同输出时(如视频墙、超高清晰度卫星地图显示)多个系统会因为行刷新率的不同导致画面出现闪烁或者条纹。GenLock接口则能够将显卡的内部刷新率型号告知其他系统的显卡,在共同进行连续视频输出时保持行刷新同步,避免这些情况的发生。
在进行集群渲染和可视化模拟时,每个显示系统所分到的任务量并不是一致的,复杂度的不同渲染时间自然也就不同,他们在进行共同输出时就会导致最终画面错误或者破碎。所以我们需要通过FrameLock接口来传输数据缓存同步信号和行刷新信号,以保证整个集群中所有系统最终显示速率的一致和渲染结果的正确。
什么是SDI?
SDI(Serial Digital Interface, 串行数字接口)是一种被广泛应用在专业视频编辑广播领域的接口。该接口的速度为270Mb/s,能够传输10bit精度,未经任何压缩的数字视频信号。是传输质量最高的数字视频接口之一。常用于连接非线性视频编辑系统和线性视频编辑系统,也有用SDI接口进行直接视频输出和录像。随着高清晰电视的来临,SDI接口也发展出了HD-SDI格式。
对OpenGL完善的支持
DirectX是娱乐显卡所必须遵循的规范,而专业图形卡所必须遵循的规范显然就是OpenGL了。OpenGL 1.0尽管已经发表了近十年,但灵活的扩展性和开放性使得OpenGL依然成为最强悍的图形API。事实上,所有关于图形学的研究都涉及OpenGL,所有的专业2D、3D程序都构建在OpenGL之上。专业图形卡只有提供对OpenGL完善的支持,才能正确的运行所有应用。
随着OpenGL 2.0的发布,各专业图形卡制造商也纷纷推出了支持OpenGL 2.0的驱动程序。3Dlabs作为OpenGL的缔造者之一,表现当然是惊人的迅速。而NVIDIA的OpenGL 2.0驱动也紧随其后。至于ATI则步伐相对慢了一点。
绝对的稳定性
在几百个小时的工作即将完成时,系统的突然崩溃!这样一次崩溃往往会对用户造成极大的损失。专业工作站基本都是7x24不间断工作的,这样的工作环境对于硬件来说绝对是个挑战。因此所有的专业图形卡都不惜工本的采用最为顶级的元件和较为保守的设计。所以即便是做工远超同系列游戏卡的专业图形卡,其核心/显存频率较之依然有所降低。
在驱动方面,专业图形卡为了保证渲染结果和精度往往也会牺牲一定的速度。与此同时,为了获得对相应软件的完美支持,各大图形卡制造商还与软件生产商进行相互的合作,甚至有专门对应某软件的驱动版本以便获得速度和稳定性的提升。在厂商认证方面,无论是NVIDIA还是3Dlabs抑或ATi都做的相当好,几乎所有找得到的DCC、CAD等软件都有相应的通过厂商认证的驱动。
足够高的渲染精度
几乎所有的3D工作者都会遇到这样的情况:在3D软件中建模完成之后,发现有些圆弧部分、人体的关节部分有明显闪烁的黑点,或者是直接破裂。这样的情况就是专业图形卡的精度不足导致的。早期ATi的专业图形卡如FireGL X1只有4bit的子象素精度,同时Z-Buffer的精度也较为底下,在渲染大部分圆弧过渡的对象时都会产生破裂和黑点。而3Dlabs和NVIDIA则很早就将子象素精度提高到了12bit甚至是16bit,彻底杜绝了该问题的产生。在我们本次的测试中,所有显卡都没有发生因为子象素精度不足导致的画面错误。
SPECapc For maya 6测试由3个场景共30项测试组成,其中27项测试将会循环运行3次。其中鱿鱼、蚂蚁两个场景由NVIDIA提交,SPEC全体成员审核通过。在SPECapc for Maya测试中图形子系统性能将会占总成绩的70%,而CPU性能占20%、I/O子系统(包含内存速度和硬盘速度)性能占10%。在这个测试中,得分为1的参考系统为Pentium 4 1.5GHz、1GB PC800 ECC RDRAM和NVIDIA Quadro2 Pro图形卡、20GB ATA/100硬盘。如果目标系统的得分为2,则可以表明在日常使用中完成相同工作量,目标系统只需要耗费参考系统50%的时间。
在本次测试中NVIDIA QuadroFX 1400 SLI取得了最高图形性能得分,QuadroFX 1400紧随其次。QuadroFX 1400的全面胜利,源于NVIDIA驱动能够完整的提供Maya Hardware Rendering的硬件加速支持。3dlabs Wildcat Realizm 800由于驱动程序缺乏相应的支持,导致成绩垫底。而FireGL V7100同样因为对Maya硬件渲染和实时预览的支持问题导致成绩偏低
SPECapc for 3ds max7包含众多的测试场景,场景选择覆盖了简单的三角形到复杂建模和大型场景。由于在3ds max7中DirectX加速和OpenGL加速都已经相当完善,而DirectX加速甚至效率更高,因此SPECapc for 3ds max7测试中包含了OpenGL和DX 2种执行路径。该测试的参考平台为Intel Xeon 2.4GHz、1GB PC800 RDRAM、Quadro XGL700图形卡和40GB ATA/100硬盘。
在3ds max7测试中3dlabs Wildcat Realizm 800占据了头把交易,而QuadroFX 1400 SLI紧随其后,FireGL V7100位居第三。QuadroFX 1400垫底。这样的性能结果几乎和他们各自的售价成正比。但是Wildcat Realizm 800由于缺少对3ds max 7 Viewport的实时加速工具,导致性能成绩偏低,未能彻底释放Realizm 800的性能。
在我们完成了所有专业图形卡测试之后,我们发现单论性能,专业图形卡发展的速度极其迅猛。3dlabs依靠Wildcat Reailzm 800再次向世人展示了他的力量,而NVIDIA的QuadroFX 1400则刷新了专业图形卡性能价格比的标准。至于ATi FireGL V7100则依然缺乏强大的竞争力。如果你的工作包含极端复杂的3D模型和海量的纹理,那3dlabs Wildcat Realizm 800将有助你显著提升工作效率。对于预算有限的SOHO设计师和初学者来说QuadroFX 1400将会是他们最佳选择。
在整个测试中,对专业图形卡的功能和加速范围上我们依然有所期待。现在市场上所有专业图形卡在最终渲染方面都无能为力,在Mental Ray、Final Render等渲染器大行其道的今天,显然最终渲染耗费了大量的时间。要加速GI渲染,我们需要的更像是IBM Cell处理器那样的MIMD处理能力,而不是游戏卡上极端的填充率和几何设置能力。在经历了游戏和专业的融合之后,也许今天游戏图形卡和专业图形卡应该再次分道扬镳、各自发展了?