什么是显卡? 显卡的工作非常复杂,但其原理和部件很容易理解。在本文中,我们先来了解显卡的基本部件和它们的作用。此外,我们还将考察那些共同发挥作用以使显卡能够快速、高效工作的因素。 显示卡(videocard)是系统必备的装置,它负责将 CPU 送来的影像资料(data)处理成显示器(monitor) 可以了解的格式,再送到显示屏 (screen) 上形成影像。它是我们从电脑获取资讯最重要的管道。因此显示卡及显示器是电脑最重要的部份之一。我们在监视器上看到的图像是由很多个小点组成的,这些小点称为“像素”。在最常用的分辨率设置下,屏幕显示一百多万个像素,电脑必须决定如何处理每个像素,以便生成图像。为此,它需要一位“翻译”,负责从CPU获得二进制数据,然后将这些数据转换成人眼可以看到的图像。除非电脑的主板内置了图形功能,否则这一转换是在显卡上进行的。我们都知道,计算机是二进制的,也就是0和1,但是总不见的直接在显示器上输出0和1,所以就有了显卡,将这些0和1转换成图像显示出来。 显卡的基本原理 显卡的主要部件是:主板连接设备、监视器连接设备、处理器和内存。不同显卡的工作原理基本相同CPU与软件应用程序协同工作,以便将有关图像的信息发送到显卡。显卡决定如何使用屏幕上的像素来生成图像。之后,它通过线缆将这些信息发送到监视器。 显卡的演变自从IBM于1981年推出第一块显卡以来,显卡已经有了很大改进。第一块显卡称为单色显示适配器(MDA),只能在黑色屏幕上显示绿色或白色文本。而现在,新型显卡的最低标准是视频图形阵列(VGA),它能显示256种颜色。通过像量子扩展图矩阵(QuantumExtendedGraphicsArray,QXGA)这样的高性能标准,显卡可以在最高达2040x1536像素的分辨率下显示数百万种颜色。 根据二进制数据生成图像是一个很费力的过程。为了生成三维图像,显卡首先要用直线创建一个线框。然后,它对图像进行光栅化处理(填充剩余的像素)。此外,显卡还需添加明暗光线、纹理和颜色。对于快节奏的游戏,电脑每秒钟必须执行此过程约60次。如果没有显卡来执行必要的计算,则电脑将无法承担如此大的工作负荷。 显卡工作的四个主要部件 显卡在完成工作的时候主要靠四个部件协调来完成工作,主板连接设备,用于传输数据和供电,处理器用于决定如何处理屏幕上的每个像素,内存用于存放有关每个像素的信息以及暂时存储已完成的图像,监视器连接设备便于我们查看最终结果。 处理器和内存 像主板一样,显卡也是装有处理器和RAM的印刷电路板。此外,它还具有输入/输出系统(BIOS)芯片,该芯片用于存储显卡的设置以及在启动时对内存、输入和输出执行诊断。显卡的处理器称为图形处理单元(GPU),它与电脑的CPU类似。但是,GPU是专为执行复杂的数学和几何计算而设计的,这些计算是图形渲染所必需的。某些最快速的GPU所具有的晶体管数甚至超过了普通CPU。GPU会产生大量热量,所以它的上方通常安装有散热器或风扇。 除了其处理能力以外,GPU还使用特殊的程序设计来帮助自己分析和使用数据。市场上的绝大多数GPU都是AMD和NV生产的,并且这两家公司都开发出了自己的GPU性能增强功能。为了提高图像质量,这些处理器使用全景抗锯齿技术,它能让三维物体的边缘变得平滑,以及各向异性过滤,它能使图像看上去更加鲜明。 GPU在生成图像时,需要有个地方能存放信息和已完成的图像。这正是显卡RAM用途所在,它用于存储有关每个像素的数据、每个像素的颜色及其在屏幕上的位置。有一部分RAM还可以起到帧缓冲器的作用,这意味着它将保存已完成的图像,直到显示它们。通常,显卡RAM以非常高的速度运行,且采取双端口设计,这意味着系统可以同时对其进行读取和写入操作。 RAM直接连接到数模转换器,即DAC。这个转换器也称为RAMDAC,用于将图像转换成监视器可以使用的模拟信号。有些显卡具有多个RAMDAC,这可以提高性能及支持多台监视器。 显卡输入和输出 ADC连接器苹果公司曾经制造过使用专利产品AppleDisplayConnector(ADC)的监视器。尽管这些监视器目前仍在使用,但苹果公司新出的监视器已改为使用DVI连接设备。显卡通过主板连接到电脑主板为显卡供电,并使其可以与CPU通信。对于较高端的显卡,主板所提供的电能往往不足,所以显卡还直接连接到电脑的电源。 显卡与主板的连接通常是借助外设部件互连(PCI)、高级图形端口(AGP)、PCIExpress(PCIe)等三种接口接口来实现的,在这三种接口中,PCIExpress是最新型的接口,它能在显卡和主板之间提供最快的传输速率。此外,PCIe还支持在一台电脑中使用两块显卡。 大多数人仅使用他们具有的两种监视器连接设备中的一种。需要使用两台监视器的用户可以购买具有双头输出功能的显卡,它能将画面分割并显示到两个屏幕上。理论上,如果电脑配有两块具有双头输出功能且提供PCIe接口的显卡,则它能够支持四台监视器。除了用于主板和监视器的连接设备以外,有些显卡还具有用于以下用途的连接设备:电视显示:电视输出或S-Video、模拟摄像机:ViVo(视频输入/视频输出、数码相机:火线或USB有些显卡还自带了电视调谐器。 影响显卡速度和效率的因素 DirectX和OpenGLDirectX和OpenGL都是应用程序编程接口,简称API。API提供用于复杂任务(例如三维渲染)的指令,以此帮助软硬件更高效地通信。开发人员针对特定的API来优化大量使用图形的游戏。这就是最新的游戏通常需要DirectX或OpenGL的更新版才能正确运行的原因。 API不同于驱动程序。驱动程序是使硬件可以与电脑的操作系统进行通信的程序。但如同更新版的API一样,更新版的设备驱动程序可以帮助程序正确运行。 如何衡量显卡好坏? 顶级显卡很容易辨认,它应该具有大量内存和速度很快的处理器。此外,与其他任何要安装到电脑机箱中的部件相比,它通常是最令人关注的。很多高性能显卡都声称需要或直接配备了外形夸张的风扇或散热器。 但高端显卡提供的功能超出了大多数人的真实需要。对于主要使用电脑来收发电子邮件、从事文字处理或上网冲浪的用户来说,带有集成显卡的主板便能够提供所有必要的图形功能。对于大多数偶尔玩游戏的用户来说,中端显卡已经足以满足需要。只有游戏迷和那些需要完成大量三维图形工作的用户才需要高端显卡。 显卡性能的一个很好的整体衡量标准是它的帧速,它是以每秒的帧数(FPS)为单位加以衡量的。帧速说明了显卡每秒钟能显示多少幅完整的图像。人眼的处理能力约为每秒25帧,而动感快速的游戏至少需要60FPS的帧速才能提供平滑的动画和滚动。影响帧速的因素包括:每秒生成的三角形数或顶点数三维图像是由三角形或多边形组成的。这项指标说明了GPU能够以多快的速度计算整个多边形或对该多边形进行定义的顶点。一般而言,它说明了显卡能以多快的速度生成线框图像。 像素填充速率:这项指标说明了GPU一秒钟内能处理多少个像素,从而也就说明了显卡能以多快的速度对图像进行光栅化处理。显卡的硬件对其速度具有直接影响。以下是对显卡速度影响最大的硬件性能指标及其衡量单位:GPU时钟速度(MHz)、内存总线的容量(位)、可用内存的数量(MB)、内存时钟速率(MHz) 内存带宽(GB/s)、RAMDAC速度(MHz)。 电脑的CPU和主板也对显卡速度有一定影响,因为非常快速的显卡并不能弥补主板在快速传输数据方面的能力的不足。同样,显卡与主板之间的连接以及它从CPU获取指令的速度都会影响其性能。 超频有些用户选择将自己显卡的时钟速度手动设置为更高的速率,以此来提高显卡的性能,这称为超频。人们通常选择对显卡的内存进行超频,因为对GPU进行超频可能会导致过热。虽然超频可以获得更好的性能,但它也会使制造商的质保失效。 显卡主要参数术语解释: 显示芯片 又称图型处理器-GPU,它在显卡中的作用,就如同CPU在电脑中的作用一样。更直接的比喻就是大脑在人身体里的作用。GPU使显卡减少了对CPU的依赖,并进行部分原本CPU的工作,尤其是在3D图形处理时。GPU所采用的核心技术有硬件T&L(几何转换和光照处理)、立方环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图、双重纹理四像素256位渲染引擎等,而硬件T&L技术可以说是GPU的标志。GPU的生产主要由nVidia与ATI两家厂商生产。 开发代号 所谓开发代号就是显示芯片制造商为了便于显示芯片在设计、生产、销售方面的管理和驱动架构的统一而对一个系列的显示芯片给出的相应的基本的代号。开发代号作用是降低显示芯片制造商的成本、丰富产品线以及实现驱动程序的统一。 一般来说,显示芯片制造商可以利用一个基本开发代号再通过控制渲染管线数量、顶点着色单元数量、显存类型、显存位宽、核心和显存频率、所支持的技术特性等方面来衍生出一系列的显示芯片来满足不同的性能、价格、市场等不同的定位,还可以把制造过程中具有部分瑕疵的高端显示芯片产品通过屏蔽管线等方法处理成为完全合格的相应低端的显示芯片产品出售,从而大幅度降低设计和制造的难度和成本,丰富自己的产品线。同一种开发代号的显示芯片可以使用相同的驱动程序,这为显示芯片制造商编写驱动程序以及消费者使用显卡都提供了方便。 制造工艺 制造工艺指得是在生产GPU过程中,要进行加工各种电路和电子元件,制造导线连接各个元器件。通常其生产的精度以nm(纳米)来表示(1mm=1000000nm),精度越高,生产工艺越先进。在同样的材料中可以制造更多的电子元件,连接线也越细,提高芯片的集成度,芯片的功耗也越小。 微电子技术的发展与进步,主要是靠工艺技术的不断改进,使得器件的特征尺寸不断缩小,从而集成度不断提高,功耗降低,器件性能得到提高。芯片制造工艺在1995年以后,从0.5微米、0.35微米、0.25微米、0.18微米、0.15微米、0.13微米、0.09微米,再到主流的65 纳米、55纳米、40纳米。 核心频率 显卡的核心频率是指显示核心的工作频率,其工作频率在一定程度上可以反映出显示核心的性能,但显卡的性能是由核心频率、流处理器单元、显存频率、显存位宽等等多方面的情况所决定的,因此在显示核心不同的情况下,核心频率高并不代表此显卡性能强劲。比如GTS250的核心频率达到了750MHz,要比GTX260+的576MHz高,但在性能上GTX260+绝对要强于GTS250。在同样级别的芯片中,核心频率高的则性能要强一些,提高核心频率就是显卡超频的方法之一。 显卡BIOS 显卡BIOS 主要用于存放显示芯片与驱动程序之间的控制程序,另外还存有显示卡的型号、规格、生产厂家及出厂时间等信息。打开计算机时,通过显示BIOS 内的一段控制程序,将这些信息反馈到屏幕上。早期显示BIOS 是固化在ROM 中的,不可以修改,而多数显示卡则采用了大容量的EPROM,即所谓的Flash BIOS,可以通过专用的程序进行改写或升级。 显存 显示内存的简称。顾名思义,其主要功能就是暂时将储存显示芯片要处理的数据和处理完毕的数据。图形核心的性能愈强,需要的显存也就越多。以前的显存主要是SDR的,容量也不大。市面上的显卡大部分采用的是GDDR3显存,现在最新的显卡则采用了性能更为出色的GDDR4或GDDR5显存。显存主要由传统的内存制造商提供,比如三星、现代、Kingston等。显卡上采用的显存类型主要有SDR DDR SDRAM,DDR SGRAM、 DDR2 、DDR3 、DDR4 、DDR5。 DDR SGRAM 是显卡厂商特别针对绘图者需求,为了加强图形的存取处理以及绘图控制效率,从同步动态随机存取内存(SDRAM)所改良而得的产品。SGRAM允许以方块 (Blocks) 为单位个别修改或者存取内存中的资料,它能够与中央处理器(CPU)同步工作,可以减少内存读取次数,增加绘图控制器的效率,尽管它稳定性不错,而且性能表现也很好,但是它的超频性能很差。 显存位宽 显存位宽是显存在一个时钟周期内所能传送数据的位数,位数越大则瞬间所能传输的数据量越大,这是显存的重要参数之一。2009年市场上的显存位宽有64位、128位、256位和512位几种,人们习惯上叫的64位显卡、128位显卡和256位显卡就是指其相应的显存位宽。显存位宽越高,性能越好价格也就越高,因此512位宽的显存更多应用于高端显卡,而主流显卡基本都采用128和256位显存。 显存带宽=显存频率X显存位宽/8,在显存频率相当的情况下,显存位宽将决定显存带宽的大小。显卡的显存是由一块块的显存芯片构成的,显存总位宽同样也是由显存颗粒的位宽组成。显存位宽=显存颗粒位宽×显存颗粒数。显存颗粒上都带有相关厂家的内存编号,可以去网上查找其编号,就能了解其位宽,再乘以显存颗粒数,就能得到显卡的位宽。 显存速度 显存速度一般以ns(纳秒)为单位。常见的显存速度有1.2ns、1.0ns、0.8ns等,越小表示速度越快、越好。 显存的理论工作频率计算公式是:等效工作频率(MHz)=1000/(显存速度×n)(n因显存类型不同而不同,如果是GDDR3显存则n=2;GDDR5显存则n=4)。 显存频率 显存频率一定程度上反应着该显存的速度,以MHz(兆赫兹)为单位,显存频率随着显存的类型、性能的不同而不同;DDR SDRAM显存则能提供较高的显存频率,因此是采用最为广泛的显存类型,无论中、低端显卡,还是高端显卡大部分都采用DDR SDRAM,其所能提供的显存频率也差异很大,主要有400MHz、500MHz、600MHz、650MHz等,高端产品中还有800MHz或900MHz,乃至更高。 流处理器单元 在DX10显卡出来以前,并没有“流处理器”这个说法。GPU内部由“管线”构成,分为像素管线和顶点管线,它们的数目是固定的。简单来说,顶点管线主要负责3D建模,像素管线负责3D渲染。由于它们的数量是固定的,这就出现了一个问题,当某个游戏场景需要大量的3D建模而不需要太多的像素处理,就会造成顶点管线资源紧张而像素管线大量闲置,当然也有截然相反的另一种情况。 在这样的情况下,人们在DX10时代首次提出了“统一渲染架构”,显卡取消了传统的“像素管线”和“顶点管线”,统一改为流处理器单元,它既可以进行顶点运算也可以进行像素运算,这样在不同的场景中,显卡就可以动态地分配进行定点运算和像素运算的流处理器数量,达到资源的充分利用;现在,流处理器的数量的多少已经成为了决定显卡性能高低的一个很重要的指标,Nvidia和AMD-ATI也在不断地增加显卡的流处理器数量使显卡的性能达到跳跃式增长,值得一提的是,N卡和A卡GPU架构并不一样,对于流处理器数的分配也不一样。 双卡技术 SLI和CrossFire分别是Nvidia和ATI两家的双卡或多卡互连工作组模式.其本质是差不多的.只是叫法不同,SLI Scan Line Interlace(扫描线交错)技术是3dfx公司应用于Voodoo 上的技术,它通过把2块Voodoo卡用SLI线物理连接起来,工作的时候一块Voodoo卡负责渲染屏幕奇数行扫描,另一块负责渲染偶数行扫描,从而达到将两块显卡“连接”在一起获得“双倍”的性能。 SLI中文名速力,到2009年SLI工作模式与早期Voodoo有所不同,改为屏幕分区渲染。 DirectX DirectX并不是一个单纯的图形API,它是由微软公司开发的用途广泛的API,它包含有Direct Graphics(Direct 3D+Direct Draw)、Direct Input、Direct Play、Direct Sound、Direct Show、Direct Setup、Direct Media Objects等多个组件,它提供了一整套的多媒体接口方案。只是其在3D图形方面的优秀表现,让它的其它方面显得暗淡无光。DirectX开发之初是为了弥补Windows 3.1系统对图形、声音处理能力的不足,已发展成为对整个多媒体系统的各个方面都有决定性影响的接口,最新版本为DirectX 11。 |