PCI
Express是新一代的总线接口,而采用此类接口的显卡产品,已经在2004年正式面世。早在2001年的春季“英特尔开发者论坛”上,英特尔公司就提出了要用新一代的技术取代PCI总线和多种芯片的内部连接,并称之为第三代I/O总线技术。随后在2001年底,包括Intel、AMD、DELL、
IBM在内的20多家业界主导公司开始起草新技术的规范,并在2002年完成,对其正式命名为PCI Express。
PCI
Express采用了目前业内流行的点对点串行连接,比起PCI以及更早期的计算机总线的共享并行架构,每个设备都有自己的专用连接,不需要向整个总线请求带宽,而且可以把数据传输率提高到一个很高的频率,达到PCI所不能提供的高带宽。相对于传统PCI总线在单一时间周期内只能实现单向传输,PCI
Express的双单工连接能提供更高的传输速率和质量,它们之间的差异跟半双工和全双工类似。
PCI Express的接口根据总线位宽不同而有所差异,包括X1、X4、X8以及X16(X2模式将用于内部接口而非插槽模式)。较短的PCI
Express卡可以插入较长的PCI Express插槽中使用。PCI Express接口能够支持热拔插,这也是个不小的飞跃。PCI
Express卡支持的三种电压分别为+3.3V、3.3Vaux以及+12V。用于取代AGP接口的PCI
Express接口位宽为X16,将能够提供5GB/s的带宽,即便有编码上的损耗但仍能够提4GB/s左右的实际带宽,远远超过AGP 8X的2.1GB/s的带宽。
PCI Express规格从1条通道连接到32条通道连接,有非常强的伸缩性,以满足不同系统设备对数据传输带宽不同的需求。例如,PCI Express
X1规格支持双向数据传输,每向数据传输带宽250MB/s,PCI Express
X1已经可以满足主流声效芯片、网卡芯片和存储设备对数据传输带宽的需求,但是远远无法满足图形芯片对数据传输带宽的需求。 因此,必须采用PCI Express
X16,即16条点对点数据传输通道连接来取代传统的AGP总线。PCI Express
X16也支持双向数据传输,每向数据传输带宽高达4GB/s,双向数据传输带宽有8GB/s之多,相比之下,目前广泛采用的AGP
8X数据传输只提供2.1GB/s的数据传输带宽。
尽管PCI Express技术规格允许实现X1(250MB/秒),X2,X4,X8,X12,X16和X32通道规格,但是依目前形式来看,PCI
Express X1和PCI Express X16将成为PCI Express主流规格,同时芯片组厂商将在南桥芯片当中添加对PCI Express
X1的支持,在北桥芯片当中添加对PCI Express X16的支持。除去提供极高数据传输带宽之外,PCI
Express因为采用串行数据包方式传递数据,所以PCI Express接口每个针脚可以获得比传统I/O标准更多的带宽,这样就可以降低PCI
Express设备生产成本和体积。另外,PCI Express也支持高阶电源管理,支持热插拔,支持数据同步传输,为优先传输数据进行带宽优化。
在兼容性方面,PCI
Express在软件层面上兼容目前的PCI技术和设备,支持PCI设备和内存模组的初始化,也就是说目前的驱动程序、操作系统无需推倒重来,就可以支持PCI
Express设备。PCI Express是新一代能够提供大量带宽和丰富功能以实现令人激动的新式图形应用的全新架构。PCI
Express可以为带宽渴求型应用分配相应的带宽,大幅提高中央处理器(CPU)和图形处理器(GPU)之间的带宽。对最终用户而言,他们可以感受影院级图象效果,并获得无缝多媒体体验。
PCI
Express采用串行方式传输Data。它和原有的ISA、PCI和AGP总线不同。这种传输方式,不必因为某个硬件的频率而影响到整个系统性能的发挥。当然了,整个系统依然是一个整体,但是我们可以方便的提高某一频率低的硬件的频率,以便系统在没有瓶颈的环境下使用。以串行方式提升频率增进效能,关键的限制在于采用什么样的物理传输介质。目前人们普遍采用铜线路,而理论上铜这个材质可以提供的传输极限是10
Gbps。这也就是为什么PCI Express的极限传输速度的答案。
因为PCI
Express工作模式是一种称之为“电压差式传输”的方式。两条铜线,通过相互间的电压差来表示逻辑符号0和1。以这种方式进行资料传输,可以支持极高的运行频率。所以在速度达到10Gbps后,只需换用光纤(Fibre
Channel)就可以使之效能倍增。
PCI Express是下一阶段的主要传输总线带宽技术。然而,GPU对总线带宽的需求是子系统中最高的,显而易见的是,视频在PCI
Express应占有一定的分量。显然,PCI
Express的提出,并非是总线形式的一个结束。恰恰相反,其技术的成熟仍旧需要这个时间。当然了,趁这个时间,那些芯片、主板、视频等厂家是否能出来支持是PCI
Express发展的关键。不过,至今依然被看好的AGP8X的性能与PCI Express在性能上的差距虽然不是太明显,但是随着PCI
Express的完善,其差距将是不言而喻的。
PCI-Express是最新的总线和接口标准,它原来的名称为“3GIO”,是由英特尔提出的,很明显英特尔的意思是它代表着下一代I/O接口标准。交由PCI-SIG(PCI特殊兴趣组织)认证发布后才改名为“PCI-Express”。这个新标准将全面取代现行的PCI和AGP,最终实现总线标准的统一。它的主要优势就是数据传输速率高,目前最高可达到10GB/s以上,而且还有相当大的发展潜力。PCI
Express也有多种规格,从PCI Express 1X到PCI Express
16X,能满足现在和将来一定时间内出现的低速设备和高速设备的需求。能支持PCI
Express的主要是英特尔的i915和i925系列芯片组。当然要实现全面取代PCI和AGP也需要一个相当长的过程,就象当初PCI取代ISA一样,都会有个过渡的过程。
PCI
Express(以下简称PCI-E)采用了目前业内流行的点对点串行连接,比起PCI以及更早期的计算机总线的共享并行架构,每个设备都有自己的专用连接,不需要向整个总线请求带宽,而且可以把数据传输率提高到一个很高的频率,达到PCI所不能提供的高带宽。相对于传统PCI总线在单一时间周期内只能实现单向传输,PCI-E的双单工连接能提供更高的传输速率和质量,它们之间的差异跟半双工和全双工类似。
PCI-E的接口根据总线位宽不同而有所差异,包括X1、X4、X8以及X16,而X2模式将用于内部接口而非插槽模式。PCI-E规格从1条通道连接到32条通道连接,有非常强的伸缩性,以满足不同系统设备对数据传输带宽不同的需求。此外,较短的PCI-E卡可以插入较长的PCI-E插槽中使用,PCI-E接口还能够支持热拔插,这也是个不小的飞跃。PCI-E
X1的250MB/秒传输速度已经可以满足主流声效芯片、网卡芯片和存储设备对数据传输带宽的需求,但是远远无法满足图形芯片对数据传输带宽的需求。
因此,用于取代AGP接口的PCI-E接口位宽为X16,能够提供5GB/s的带宽,即便有编码上的损耗但仍能够提供约为4GB/s左右的实际带宽,远远超过AGP
8X的2.1GB/s的带宽。
尽管PCI-E技术规格允许实现X1(250MB/秒),X2,X4,X8,X12,X16和X32通道规格,但是依目前形式来看,PCI-E X1和PCI-E
X16已成为PCI-E主流规格,同时很多芯片组厂商在南桥芯片当中添加对PCI-E X1的支持,在北桥芯片当中添加对PCI-E
X16的支持。除去提供极高数据传输带宽之外,PCI-E因为采用串行数据包方式传递数据,所以PCI-E接口每个针脚可以获得比传统I/O标准更多的带宽,这样就可以降低PCI-E设备生产成本和体积。另外,PCI-E也支持高阶电源管理,支持热插拔,支持数据同步传输,为优先传输数据进行带宽优化。
[编辑本段]PCI Express与其他传输规格比较
PCI Express x16 插槽
PCI Express x1 插槽
PCIe的规范主要是为了提升电脑内部所有总线的速度,因此频宽有多种不同规格标准,其中PCIe
x16是专为显卡所设计的部分。AGP的资料传输效率最高为2.1GB/s,不过对上PCIe
x16的8GB/s,很明显的就分出胜负,但8GB/s只有指资料传输的理想值,并不是使用PCIe接口的显示卡,就能够有突飞猛进的效能表现,实际的测试数据上并不会有这么大的差异存在。
传输通道数脚Pin总数主接口区Pin数总 长 度主接口区 长度
x1361425 mm7.65 mm
x4644239 mm21.65 mm
x8987656 mm38.65 mm
x1616414289 mm71.65 mm
规格总线宽度工作时脉传输速率
PCI 2.332 位元33/66 MHz133/266 MiB/s
PCI-X 1.064 位元66/100/133 MHz533/800/1066 MiB/s
PCI-X 2.0(DDR)64 位元133 MHz2.1 GiB/s
PCI-X 2.0(QDR)64 位元133 MHz4.2 GiB/s
AGP 2X64 位元66 MHz532 MiB/s
AGP 4X64 位元66 MHz1.0 GiB/s
AGP 8X64 位元66 MHz2.1 GiB/s
PCI-E 1X8 位元2.5 GHz512 MiB/s(双工)
PCI-E 2X8 位元2.5 GHz1.0 GiB/s(双工)
PCI-E 4X8 位元2.5 GHz2.0 GiB/s(双工)
PCI-E 8X8 位元2.5 GHz4.0 GiB/s(双工)
PCI-E 16X8 位元2.5 GHz8.0 GiB/s(双工)
甚至对于某些 PCI-E 1X插槽,我们完全可以将其锯开(这样有可能会失去质保),比如可以用来插上NVDIA的显卡做为物理加速卡与ATI显卡一同工作。
[编辑本段]解决PCI Express协议一致性问题
在开发第一块基于PCI Express的SoC过程中,ClearSpeed公司为了在有限的时间和预算条件下确保PCI
Express协议一致性而面临重重困难。PCI
Express是一种复杂的协议,具有特别大的覆盖范围。从管理的角度看,保证协议一致性没有其它更好的方法,只有采用标准驱动的验证过程。遗憾的是,即使做了上千次覆盖相关场景的测试,仍留有相当大的覆盖漏洞,从而使得这个方法没有可预测性,成本也很高。而另外一种普通的随机测试方法也没有足够的可预测性。
ClearSpeed公司开始意识到,理想的方法可以产生显著的好处:它能最小化技术开发工作量,同时最大化测试应用控制。ClearSpeed公司率先采用Cadence公司提供的商用化PCIe验证IP。这种验证IP被称为UVC,包含了一致性管理系统(CMS),该系统将覆盖空间划分和映射到了PCIe规范。CMS还提供受限随机测试(称为测试序列)形式的一致性测试套件,用于自动取得针对每个PCIe规范部分的高功能性覆盖。
ClearSpeed公司还在UVC基础上创建了自己的受限随机测试套件。相关覆盖在每次测试组运行之后都会进行分析,从而能清楚地理解覆盖漏洞出现在什么地方,并指导新的测试应在什么地方进行以到达未被覆盖的场景。这种方法还向ClearSpeed提供了无价的项目管理工具,因为它能帮助理解和报告验证状态。ClearSpeed公司目前能够在每个主要的规范领域正常地跟踪覆盖、缺陷统计和测试故障。
工程背景
ClearSpeed公司的产品范围包括芯片、加速器卡、机架模块、软件和支持。ClearSpeed公司的芯片、加速器卡和机架模块都可以与工业标准的x86系统一起使用。ClearSpeed公司的芯片采用C语言进行编程,并且公司向用户提供可与所有标准软件开发工具协同工作的完整IDE.
与以前的CXS600芯片相比,主要变化如下:
1. 一个芯片上有两个处理器内核(“MTAP”)
2. 芯片上有一个标准的PCIe接口(相对私有PCIx接口而言)
3. MTAP有多项的改进
总体验证需求和策略
图1给出了ClearSpeed产品的架构。为了确保这个复杂产品的质量,需要对以下性能进行验证:
1. 驱动程序代码与芯片的紧密集成
2. 众多软件库和应用程序的集成
3. 与各种主机(操作系统和芯片组)环境的兼容性
4. 高性能和低功率
从芯片本身看,主要验证挑战是最新引入的PCIe接口。为了应对这些验证挑战,ClearSpeed公司采用了一种适合待测复杂设计的先进验证策略。整个验证策略中有一些要点是可以明确的:
1. 这种验证策略是以仿真为基础,并采用了覆盖驱动的伪随机方法。
2. 使用了分层仿真策略,从模块级开始,并逐渐向外扩展。
3. 与软件的协同仿真非常重要,它有助于展示产品的正确性,并在芯片回厂时为硅片取得成功取得了良好开端。
4. 软件协同仿真也是分层执行的,从驱动程序开始,一直扩展到应用程序。
5. 模块和层次体系之间的验证再利用。
6. 使用验证IP。这样做有利于充分利用该领域专家的现有知识,并有利于加快测试平台的开发速度。
总的验证指导原则是在芯片开发初期从商业和技术角度获得签字确认标准。这些确认标准是客观性的,可以使用合适的准则进行测量。这样做具有很多优点,包括:
1. 能够使所有感兴趣方预先同意用于验证的对象。
2. 能够在项目执行中跟踪向验证签字确认方向发展的进程。
3. 能够建立流片时的信心。
为了与上述原则保持一致,预先对CSX700验证确认标准进行了定义。所选的关键指标有:
1. 功能覆盖目标:
(1) 优先级1覆盖目标达到100%
(2) 所有其它覆盖目标至少达到95%,并检查所有未实现的覆盖目标。
2. 编写和支持的所有系统级测试。
3. 在所有可用PCIe服务器中工作的原型PCIe。
4. 检查缺陷发现率以确保(与功能覆盖一起)我们正在接近所有最重要缺陷已经被发现的点。
5. 检查任何突出并已知未修复的问题,并评估它们的影响。
下面将在上文描述的总体验证策略框架下讨论PCIe验证策略。
模块级验证
PCIe模块级测试平台。ClearSpeed公司已经开发过图中所示的AVCI、PVCI和私有协议,因此PCIe接口提出了主要的验证挑战。由于我们使用的IP来自不同的管线PHY和端点内核供应商,因此这种挑战越发艰巨。
测试平台采用了许多UVC。除了PCIe
UVC外,其它UVC都是ClearSpeed公司自己开发的。测试平台的其它部分使用公司自己的UVC有利于建立同质的eRM一致性系统(随后的uRM和现在的OVM)。
选用第三方VIP的原因是因为:PCIe协议的复杂性;验证任务的工作量以及缺少内部资源;VIP的成熟度;独立的VIP可以由与内部开发小组不相干的外部PCIe专家组开发。
系统级测试
系统级测试平台包括了芯片和软件驱动堆栈。实际的软件驱动程序基本原样投入使用,除了在堆栈底部做了一些修改,即将调用做进了仿真环境中,并由软件驱动PCIe
UVC。更多细节请参考图4。在本例中,驱动程序完成与硬件对话要做的所有事情,并且每个事务都要传送给仿真器。这样运行起来虽然比较慢,但确实能让我们测试DMA引擎等。
驱动程序可以连接到PCIe层上面的仿真器。这样无需花费时间在完整仿真每个PCI事务上面就可以实现对更高层单元的仿真。这对仿真在处理器上运行的程序来说是非常有用的。
虽然通过使用UVC可以在测试规范允许的地方(例如在一些要写入的数据中,在定义范围内的地址中)使用受限随机激励,但在系统级主要应用定向测试方法。在系统级存在许多现成的定向测试,主要目标是用它们扩展测试这个芯片的变化(如前所列出的)。许多vPlanning会话被保持以获得测试规范,然后我们就能跟踪这些测试的实现。一旦驱动程序堆栈经验证能与RTL一起工作,就可以运行较高层的软件。
运行这些应用程序能给功能验证和性能验证带来高度的信心。
在CSX700的开发过程中,ClearSpeed公司生产了一种基于现有硅片(CSX600)但用FPGA提供PCIe接口的产品,这样允许我们模拟PCIe接口并执行兼容性测试。也就是说,我们能将被模拟的PCIe接口连接到运行各种OS的众多服务器上,从而在流片前确定兼容性问题。它还能让我们更彻底地测试带PCIe的软件驱动程序堆栈接口。
该方法可以识别主要位于PCIe堆栈物理层中的缺陷(FPGA中的PHY不同于我们芯片中的PHY),也让我们注意到我们连接的服务器中PCIe实现的变化数量,并促使我们提升取得很高覆盖的重要性:我们对覆盖划分优先等级,并为最高优先级对象设定100%的目标。然而,该方法不能识别通过仿真&覆盖也不能发现的PHY外的任何缺陷。这使我们相信,PCIe仿真中的高覆盖将有助于取得很高的首次流片成功率。
原型的其它优势还表现在软件开发方面。它能帮助PCIe软件驱动程序远早于CSX700硅片开发出来,加快基于CSX700的产品的上市时间。
可配置的验证环境
用于PCI Express的Incisive UVC能让用户专注于设计的任何部分或整个设计,并针对验证过程中每一阶段的特殊需要优化验证环境。Incisive
UVC一般用于在模块、芯片和系统级对PCI
Express器件进行功能验证。它也可以通过配置有选择地激活或关闭各个功能模块以及功能覆盖和检测机制来优化特殊任务的验证。这样可以提供到验证收敛的最可预测路径,并最大化在仿真器和工作站方面做出的投资回报。
自动激励产生
与使用上千次定向测试的其它解决方案不同,用于PCI
Express的UVC采用自动激励发生器来减少用户需要做的工作量。利用包含所供序列库在内的自动化情景产生功能,用户可以覆盖主要协议功能以及难以到达的情景和边界案例。通过增加少量测试,剩余的边界案例就能被一一验证。这种方法有助于用户更快地发现更多缺陷,并让设计师有更多的时间进行DUT的私有功能测试。CMS可以实现整个过程的自动化。
使用CMS实现覆盖驱动的验证
CMS向用户提供了可执行的验证计划(vPlan)。vPlan与Enterprise
Manager以及内置功能覆盖模型一起可以提供清晰地报告哪些被覆盖、还有哪些没被覆盖所需的标准。这给用户提供了验证过程的路线图、收敛标准以及可预测的验证过程,并向项目或管理方提供明晰的状态报告。这种方法被称为覆盖驱动的验证,可以帮助验证人员方便地识别覆盖漏洞,并将资源集中用于DUT的有问题部分。
Cadence的再利用方法可以快速建立功能验证环境,确保在从模块级验证向芯片级、系统级验证转移以及派生设计时能立即再利用基于UVC的环境。这种方法通过消除重复工作而节省了时间与资源。
覆盖点的优先级划分
通过使用能用来屏蔽掉与DUT无关的覆盖区/条目的“透视图(perspective)”,ClearSpeed公司能够只考虑与实现有关的覆盖点。ClearSpeed使用以下这个透视图:
“端点, AER = On, VC 1-7 = Off, 完成器退出 = Off, 配置请求重试状态 = Off, 抑制 = Off"
CMS允许由主要的PCIe模块TPL、TXN、DLL、PHY、PMG、SYS和CONFIG报告覆盖,这有助于ClearSpeed公司根据技术风险划分验证工作的优先级。
我们认为物理层(PHY)存在较高的风险,因为物理层有两个不同的IP供应商,而且FPGA原型测试中没有覆盖PHY(因为FPGA使用不同的PHY);Power
mgt是下一个最高优先级对象,因为在FPGA原型中没有覆盖到它(由于技术限制的原因);数据链路层是下一优先等级,因为它靠近PHY。
我们还要求更细颗粒的优先级划分:模块内的优先级划分。虽然一般来说可以使用透视图进行优先级划分,但这种方法不能满足所有需要和优先级划分的使用模型。它缺少更细的颗粒和一些对CMS专业用户(如ClearSpeed和IP开发人员)来说更重要的再利用因素。
一致性测试套件
CMS提供的一致性测试可以使你一开始就有一个很好的基本覆盖,并因此而快速启动验证工作。ClearSpeed公司是比较早介入的,在整个项目中也在不断自我修正(附加的覆盖项目和一致性测试),因此一致性测试取得的覆盖在项目过程中会有变化。据Cadence公司目前估计,用户通过使用现成的CMS测试套件能够达到约70%的覆盖。
CMS测试也能经过配置进入PCIe协议的边界案例。然后,我们就可以写出许多自己的测试来驱动UVC达到想要的覆盖水平。[1]
[编辑本段]PCI Express 1.0与PCI Express 2.0的区别
PCI Express 2.0是PCI Express总线家族中的第二代版本。其中第一代的PCI Express
1.0标志于2002年正式发布,它采用高速串行工作原理,接口传输速率达到2.5GHz,而PCI Express
2.0则在1.0版本基础上更进了一步,将接口速率提升到了5GHz,传输性能也翻了一番。目前新一代芯片组产品均可支持PCI Express
2.0总线技术,X1模式的扩展口带宽总和可达到1GB/s,X16图形接口更可以达到16GB/s的惊人带宽值。
[编辑本段]PCI Express的硬件协议
PCIe的连接是建立在一个双向的序列的(1-bit)点对点连接基础之上,这称之为“传输通道”。与PCI
连接形成鲜明对比的是PCI是基于总线控制,所有设备共同分享的单向32位并行总线。PCIe是一个多层协议,由一个对话层,一个数据交换层和一个物理层构成。物理层又可进一步分为逻辑子层和电气子层。逻辑子层又可分为物理代码子层(PCS)和介质接入控制子层(MAC)。
物理层
各式不同的PCI Express插槽(由上而下:x4, x16, x1,与 x16),相较于传统的32-bit
PCI插槽(最下方),取自于DFI的LanParty nF4 Ultra-D机板
于使用电力方面,每组流水线使用两个单向的低电压差分信号(LVDS)合计达到2.5兆波特。传送及接收不同数据会使用不同的传输通道,每一通道可运作四项资料。两个PCIe设备之间的连接成为“链接”,这形成了1组或更多的传输通道。各个设备最少支持1传输通道(x1)的链接。也可以有2,4,8,16,32个通道的链接。这可以更好的提供双向兼容性。(x2模式将用于内部接口而非插槽模式)PCIe卡能使用在至少与之传输通道相当的插槽上(例如x1接口的卡也能工作在x4或x16的插槽上)。一个支持较多传输通道的插槽可以建立较少的传输通道(例如8个通道的插槽能支持1个通道)。PCIe设备之间的链接将使用两设备中较少通道数的作为标准。一个支持较多通道的设备不能在支持较少通道的插槽上正常工作,例如x4接口的卡不能在x1的插槽上正常工作(插不入),但它能在x4的插槽上只建立1个传输通道(x1)。PCIe卡能在同一数据传输通道内传输包括中断在内的全部控制信息。这也方便了与PCI的兼容。多传输通道上的数据传输采取交叉存取,这意味着连续字节交叉存取在不同的通道上。这一特性被称之为“数据条纹”,需要非常复杂的硬件支持连续数据的同步存取,也对链接的数据吞吐量要求极高。由于数据填充的需求,数据交叉存取不需要缩小数据包。与其它高速数传输协议一样,时钟信息必须嵌入信号中。在物理层上,PCIe采用常见的8B/10B代码方式来确保连续的1和0字符串长度符合标准,这样保证接收端不会误读。编码方案用10位编码比特代替8个未编码比特来传输数据,占用20%的总带宽。有些协议(如SONET)使用另外的编码结构如“不规则”在数据流中嵌入时钟信息。PCIe的特性也定义了一种“不规则化”的运算方法,但这种方法与SONET完全不同,它的方法主要用来避免数据传输过程中的数据重复而出现数据散射。第一代PCIe采用2.5兆位单信号传输率,PCI-SIG计划在未来版本中增强到5~10兆位。
数据链接层
数据链接层采用按序的交换层信息包(Transaction Layer
Packets,TLPs),是由交换层生成,按32位循环冗余校验码(CRC,本文中用LCRC)进行数据保护,采用著名的协议(Ack and Nak
signaling)的信息包。TLPs能通过LCRC校验和连续性校验的称为Ack(命令正确应答);没有通过校验的称为Nak(没有应答)。没有应答的TLPs或者等待超时的TLPs会被重新传输。这些内容存储在数据链接层的缓存内。这样可以确保TLPs的传输不受电子噪音干扰。
Ack和Nak信号由低层的信息包传送,这些包被称为数据链接层信息包(Data Link Layer
Packet,DLLP)。DLLP也用来传送两个互连设备的交换层之间的流控制信息和实现电源管理功能。
交换层
PCI
Express采用分离交换(数据提交和应答在时间上分离),可保证传输通道在目标端设备等待发送回应信息传送其它数据信息。它采用了可信性流控制。这一模式下,一个设备广播它可接收缓存的初始可信信号量。链接另一方的设备会在发送数据时统计每一发送的TLP所占用的可信信号量,直至达到接收端初始可信信号最高值。接收端在处理完毕缓存中的TLP后,它会回送发送端一个比初始值更大的可信信号量。可信信号统计是定制的标准计数器,这一算法的优势,相对于其他算法,如握手传输协议等,在于可信信号的回传反应时间不会影响系统性能,因为如果双方设备的缓存足够大的话,是不会出现达到可信信号最高值的情况,这样发送数据不会停顿。第一代PCIe标称可支持每传输通道单向每秒250兆字节的数据传输率。这一数字是根据物理信号率2500兆波特除以编码率(10位/每字节)计算而得。这意味着一个16通道(x16)的PCIe卡理论上可以达到单向250*16=4000兆字节/秒(3.7G字节/每秒)。实际的传输率要根据数据有效载荷率,即依赖于数据的本身特性,这是由更高层(软件)应用程序和中间协议层决定。PCI
Express与其它高速序列连接系统相似,它依赖于传输的鲁棒性(CRC校验和Ack算法)。长时间连续的单向数据传输(如高速存储设备)会造成>95%的PCIe通道数据占用率。这样的传输受益于增加的传输通道,但大多数应用程序如USB或以太网络控制器会把传输内容拆成小的数据包,同时还会强制加上确认信号。这类数据传输由于增加了数据包的解析和强制中断,降低了传输通道的效率。这种效率的降低并非只出现在PCIe上。
[编辑本段]提供PCI Express 插槽的主板介绍
冠盟推出的P55主板以陆续到货,作为国内顶级OEM/ODM主板大厂的冠盟,其质量一向是毋庸至疑的。由于冠盟集中采购和强大的研发、生产实力,产品成本要低于其他通路商和中小厂,因此,市场价格要比其它同类品牌型号的产品更有优势和竞争力。该主板基于Intel
P55单芯片设计,豪华5+1相供电设计搭配优质全固态电容,目前该主板商家报价仅768元,号称为冠盟全球最低售价的P55主板,颇具性价比,是一款非常值得选购的P55产品。
冠盟GMIP55UT这款主板采用ATX大板型设计,基于Intel P55单芯片芯片组,支持刚上市的Intel LGA 1156接口的Core
i5/i7系列处理器。
冠盟GMIP55UT主板 供电方面,冠盟GMIP55UT采用了扎实的5+1相供电设计,用料上搭配全固态电容和全封闭式电感,同时MOS管全部有散热片覆盖,保证了主板的稳定运行。
主板的内存部分甚至也提供了独立的2相供电。标准的4条DDR3插槽,支持双通道DDR3
1600(OC)/1333/1066内存,最大16GB容量。单边卡扣设计方便使用长显卡的用户。扩展槽部分为我们提供了2条PCI Express
X16独立显卡插槽,支持最新的Nvidia SLI和ATI CrossFire多卡互连技术,同时还提供了2条PCI Express X1插槽和2条PCI插槽。
背板I/O接口方面,提供了一个PS/2接口,不可思意的10个USB接口,一个同轴输出,千兆网卡接口和8声道音频接口。 [2]
[编辑本段]采用pci Express技术的主板
产品名称详细参数
影驰9600GT中将版芯片厂商:NVIDIA 显卡芯片:GeForce 9600GT 制造工艺:65纳米 显存类型:GDDR3
显存容量(MB):512 总线接口:PCI Express 2.0 16X 显存速度(ns):1.0ns 显存位宽:256bit
核心频率:650MHz 显存频率:1800MHz
七彩虹逸彩9600GT-GD3 CF黄金版 512M N1芯片厂商:NVIDIA 显卡芯片:GeForce 9600GT 制造工艺:55纳米
显存类型:GDDR3 显存容量(MB):512 显存速度(ns):1.0ns 总线接口:PCI Express 2.0 16X
显存位宽:256bit 核心频率:600MHz 显存频率:1800MHz
七彩虹逸彩9800GT-GD3 冰封骑士3F 512M芯片厂商:NVIDIA 显卡芯片:GeForce 9800 GT 制造工艺:55纳米
显存类型:GDDR3 显存容量(MB):512 显存速度(ns):1.0ns 总线接口:PCI Express 2.0 16X
显存位宽:256bit 核心频率:600MHz 显存频率:1800MHz
影驰9800GT+中将版芯片厂商:NVIDIA 显卡芯片:GeForce 9800 GT 制造工艺:55纳米 显存类型:GDDR3
显存容量(MB):512 显存速度:0.8ns 总线接口:PCI Express 2.0 16X 显存位宽:256bit 核心频率:650MHz
显存频率:2200MHz
影驰GTX260+上将芯片厂商:NVIDIA 显卡芯片:GeForce GTX 260 制造工艺:55纳米 显存类型:GDDR3
显存容量(MB):896 显存速度:0.8ns 总线接口:PCI Express 2.0 16X 显存位宽:448bit 核心频率:625MHz
显存频率:2000MHz
影驰9600GT节能加强版芯片厂商:NVIDIA 显卡芯片:GeForce 9600GT 显存类型:GDDR3 显存容量(MB):512
总线接口:PCI Express 2.0 16X 显存速度:1.0ns 显存位宽:256bit 核心频率:600MHz 显存频率:1600MHz
影驰9600GT加强版芯片厂商:NVIDIA 显卡芯片:GeForce 9600GT 制造工艺:55纳米 显存类型:GDDR3
显存容量(MB):512 显存速度(ns):1.0ns 总线接口:PCI Express 2.0 16X 显存位宽:256bit
核心频率:650MHz 显存频率:1800MHz
蓝宝石HD4850 512M 海外版 HDMI芯片厂商:ATI 显卡芯片:Radeon HD 4850 制造工艺:55纳米 显存类型:GDDR3
显存容量(MB):512 显存速度(ns):1.0ns 总线接口:PCI Express 2.0 16X 显存位宽:256bit
核心频率:650MHz 显存频率:2000MHz
nVIDIA Quadro NVS 290适用类型:工作站 制造工艺:80纳米 显存位宽:64bit 核心频率:300MHz 显卡接口:PCI
Express x16或PCI Express x1 DirectX版本:10
蓝宝石HD3850蓝曜天刃PRO 512MB芯片厂商:ATI 显卡芯片:Radeon HD 3850 显存类型:DDRIII
显存容量(MB):512 显存位宽:256bit 总线接口:PCI Express 2.0 显存速度(ns):1.0ns
影驰9600GTE上将版芯片厂商:NVIDIA 显卡芯片:GeForce 9600GT 显存类型:DDRIII 显存容量(MB):512
显存位宽:256bit 总线接口:PCI Express 2.0 显存速度(ns):1.0ns
[3]
[编辑本段]PCI Express 4路采集卡
SVC404E是一款高性价比、高清晰度、质量稳定的PCI-E专业流媒体采集卡。该产品主要针对流媒体领域的要求,采用通用的 DirectShow
驱动架构,具有高效率的视频和声音采集能力。高性能的模拟视频前端滤波处理能力、高精度的音频采样能力,大大提升了视音频采集的清晰度。
注释:PCI Express是新一代能够提供大量带宽和丰富功能的新式图形架构。PCI
Express可以大幅提高中央处理器(CPU)和图形处理器(GPU)之间的带宽。它可以给视频应用者更完美地享受影院级的图象效果,并获得无缝多媒体体验。
应用领域
基于互联网流媒体在线直播、视频会议系统、VOD点播、远程监控、教学、 DVD制作,硬盘播出、广告截播、媒体资产管理。
技术特点:
四路独立的视音频采集处理。
每路独立可以调成NTSC或PAL制。
四路视频输入和四路音频输入。
每路支持最大解晰度为NTSC:720x480;PAL:720X576。
支持大多数的视音频采集软件,如Media Encoder, Helix Real Producer等。
支持最大帧率30fps。
四路无压缩视音频数据DMA信道,使得四路视音频预览零CPU占用率。
高性能的模拟视频前端滤波处理能力,使原信号得到低码率高清晰的还原。
支持软件
支持国内大多数视频会议软件,例如: AVCON视频会议系统、V2 Conference视频会议系统、网动视频会议系统;
支持Media Encoder, Helix Real Producer
支持多种编码格式,包括:Wmv9,Rmvb,Rm,MPEG-4,DivX多格式视频编码,混合不同码率、分辨率的视频同步流畅输出及播放
实时预览,全文互式与处理硬件参数能力
支持可编程时间触发(GPI,持续时调,自选键)
从现存文件中进行优化转码(AVI/Quicktime/Quicktime类型文件)到多格式编码 [4]
[编辑本段]AMD和HP将改进PCI Express 3.0规范
AMD和惠普公司的专家日前为PCI Express
3.0开发了两个新的扩展功能规范,藉由这两项新规范,除了可以降低相关微电路成本外还可以增加对多协议的支持,并且可以降低设备对中央处理器的访问频率。
相关开发人员希望他们的提案能够被明年才发布的PCI-E
3.0规范所采纳。上述两个扩展功能并不互相依赖,它们主要应用于内置系统或高速系统的图形应用。第一个扩展功能被称为多路复用协议,它利用板卡上的一系列模块,实现PCI-E和其他7种不同的协议之间的动态切换。利用该功能,我们可以构建这样一个解决方案:通过PCI-E接口,处理器和显卡通过QPI(Quick
Path Interconnect)或者HT(Hyper Transport)连接。
第二个扩展功能被称为轻信息,它允许协处理器及外围设备在存储系统的支持下,通过PCI-E接口互相通信,而不必再经过中央处理器。例如,以太网交换机可以不通过中央处理器而独立的编码和解码数据。
另外,这两项扩展功能适用于工作频率为2.5GHz、5GHz和8GHz版本的PCI-E规范。
PCI-E 3.0规范向下兼容PCI-E 2.0和PCI-E 1.0,最高传输速度可达32GB/s,有望在2010年出现相关产品。[5]
[编辑本段]PCI Express 2.0和PCI Express16的区别
PCI-E 2.0相对于目前的1.0来说,的确是名副其实的双倍规格:
带宽翻倍:将单通道PCI-E X1的带宽提高到了500MB/s,也就是双向1GB/s;
通道翻倍:显卡接口标准升级到PCI-E X32,带宽可达32GB/s;
插槽翻倍:芯片组/主板默认应该拥有两条PCI-E X32插槽;
功率翻倍:目前PCI-E插槽所能提供的电力最高为75W,2.0版本可能会提高至200W以上,目前还不确定。
PCI-Express是当前主流的总线和接口标准,它原来的名称为“3GIO”,是由Intel提出的,很明显Intel的意思是它代表着下一代I/O
接口标准。交由PCI-SIG(PCI特殊兴趣组织)认证发布后才改名为“PCI-Express”。这个新标准将全面取代现行的PCI和AGP,最终实现总线标准的统一。
1990年引进PCI总线接口时,由于其具有处理器独立性、缓冲隔绝以及总线控制和随插即用等机制及特性,不久之后便一举统一了包含ISA、VESA、VL
BUS、EISA以及MCA等总线规格,成为个人计算机中的总线插槽主流。
不过其运作频率的进步不若中央处理器那般突飞猛进,因此在面对新一代的扩充卡及周边时,已经有力不从心的感觉,而共享式的设计,单一高速周边(如Gb以太网络或IEEE
1394b)可能就会将PCI的所有频宽吃光。虽然针对特定用途也有高频率或具备独立频宽的版本(如PCI-X和AGP)出现,但是成本的高昂以及使用上的限制,这些特殊规格PCI并没有成为通用标准。
于2007年1月通过的PCI Express 2.0标准,除了在维持与目前PCI Express
1.1版兼容性的前提下,对单一通道宽度倍增以外(由原先2.5Gbps提升至5Gbps),并且在原有的特性之下加入了几项先进的功能,以期更为符合未来的需求。
I/O
Vitualization-可应用于包括设备共享、地址转换服务(ATS)以及单/多处理器系统的单独规格。可提供给多部虚拟机器共享多种包含网卡等I/O设备,有助于系统管理者在开发以及管理上的方便性。
更强的安全保护机制-可允许软件来看至互连的封包路由,以防止被不良意图人士进行欺骗以及窃取封包数据,或者是对于数据进行假路由,在未来PCI Express
2.0规范中,这个特性将会被包含在芯片组、交换芯片以及多功能组件之中。
可自动调整的连结速度-当连结频宽或速率下降时,控制软件将会自动侦测并且对硬件进行通报,而自动对连结速度进行调整,动态配置PCI Express总线的信道。
更高的供电规格-未来高阶显示卡将会更为耗电,比如说NVIDIA即将在11月发表的G80(代号)绘图卡,其耗电量可能高达300W左右,目前1.1版的PCI
Express规范只能提供70W左右,完全不敷目前及未来高阶显示卡之用,因此在2.0版规范中,将供电能力大幅提升至300W左右。
PCI Express缆线连接规范-这是属于新的应用,就如同目前SATA连接规范中有一个eSATA的外部联机标准,缆线化的PCI
Express可提供更为灵活的使用性,比如说计算机的网络、储存或显示组件就不必连接至计算机主机板上,只要透过缆线连结,显示周边与储存周边都可以拥有独立的电源以及配置空间。甚至也可以进行服务器之间的互连,达到丛集的目的。
除了以上所提到的以外,更为高速的PCI
Express也可以提供整合型图形芯片对主存储器更高的读取速度,不过依照以往的经验,在这方面的改进对于整合型图形芯片的效能增长可能并不会很大,影响效能的主要因素还是在于绘图芯片本身的设计。
不过高速序列架构不仅只于PCI
Express一家而已,类似架构的标准还有HyperTransport、Infiniband、RapidIO以及StarFabric等,这些竞争对手也都有各自庞大势力在支撑。除了背后势力以外,在技术上也不见得会输给PCI
Express,比如说Infiniband、StarFabric可藉软件追踪拓朴结构变化,以实现热插拔功能,而HyperTransport及RapidIO则是可藉由减少封包大小来加快反应速度,相较起来,PCI
Express则是显得较为中庸,延伸应用较少。
截至2006年底,PCI
Express已经成为个人计算机主机板的标准,由于其完全透明的软件层设计让软硬件开发者可以在利用最少资源的情况下得到最好的效能表现,不仅成为高阶3D加速卡的指定连接方式,对消费者来说,也成为了效能表现的代名词。至于PCI
Express在笔记型计算机上的延伸标准ExpressCard,虽然面世已有一段时间,但是在支持周边仍不够丰富的情况之下,目前仅少数笔记型计算机厂商具有较全面的支持。
1990年引进PCI总线接口时,由于其具有处理器独立性、缓冲隔绝以及总线控制和随插即用等机制及特性,不久之后便一举统一了包含ISA、VESA、VL
BUS、EISA以及MCA等总线规格,成为个人计算机中的总线插槽主流。
不过其运作频率的进步不若中央处理器那般突飞猛进,因此在面对新一代的扩充卡及周边时,已经有力不从心的感觉,而共享式的设计,单一高速周边(如Gb以太网络或IEEE
1394b)可能就会将PCI的所有频宽吃光。虽然针对特定用途也有高频率或具备独立频宽的版本(如PCI-X和AGP)出现,但是成本的高昂以及使用上的限制,这些特殊规格PCI并没有成为通用标准。
为了因应下一代周边的I/O频宽需求,以及对于整体架构上的统一化设计,Intel结合各大IT厂商,制订出PCI-Express规格。PCI-Express架构中,包含了五个堆栈层,其中与过去PCI架构在软件层(加载储存架构以及平面地址空间)方面的兼容性,确保了现存应用程序与驱动程序不需要做出任何变革即可正常运作。而由于PCI-Express在设定组态上,也同样使用了过去应用在PCI上的随插即用标准机制。软件层以封包为基础的设计,并且藉由分割执行的通讯协议,产生可由执行曾传送至I/O装置的读取以及写入需求。而连结层则是为这些封包加入编号以及错误修正码,以求达到可靠的数据传输结果。至于在传输实体层方面,则是实作了包含一传输对以及一接收对的双重单通道,每个方向皆具备有2.5Gbps的初始速度,而且可以藉由增加讯号对,以行成多路径来线性扩展。以一个信道2.5Gbps的速度为传输基础,在实体曾提供了x1、x2、x4、x8、x16以及x32等代表信道数量以及路径宽度来表示其实际传输速度。
[6]
[编辑本段]PCI Express总线的诞生和概念
虽然,除了3D显示卡以外,直到现在还没有哪个计算机配件脱离PCI总线的束缚另起炉灶,诸如千兆网卡、声卡、RAID卡等都还在循规蹈矩的奉行着PCI规范,但,PC技术的快速发展已经让PCI总线越来越显现出不足,尤其是最近的千兆网络以及视频应用等外设,会使PCI可怜的133MB/s带宽难以承受,当几个类似外设同时满负荷运转,PCI总线几近瘫痪。不但如此,随着技术的不断进步,PCI电压难以降低的缺陷越来越凸出出来,PCI规范已经成为现在PC系统的发展桎梏,彻底升级换代迫在眉睫。
到了2001年,在Intel春季的IDF上,Intel正式公布了旨在取代PCI总线的第三代I/O技术,该规范由Intel 支持的AWG(Arapahoe
Working Group)负责制定,并称之为第三代I/O总线技术(3rd Generation I/O,也就是3GIO),也就是后来的PCI
Express总线规范。不过在公布之初,应用环境、配套设备还不是很完善,并不为人们所关注。到了2002年4月17日,AWG正式宣布3GIO
1.0规范草稿制定完毕,并移交PCI-SIG进行审核,该规范最终却被命名为PCI
Express,而到了2003年Intel春季IDF上,Intel正式公布了PCI Express的产品开发计划,PCI Express最终走向应用。[7]
[编辑本段]PCI Express总线的特点和长处
PCI Express总线是一种完全不同于过去PCI总线的一种全新总线规范,与PCI总线共享并行架构相比,PCI
Express总线是一种点对点串行连接的设备连接方式,点对点意味着每一个PCI
Express设备都拥有自己独立的数据连接,各个设备之间并发的数据传输互不影响,而对于过去PCI那种共享总线方式,PCI总线上只能有一个设备进行通信,一旦PCI总线上挂接的设备增多,每个设备的实际传输速率就会下降,性能得不到保证。现在,PCI
Express以点对点的方式处理通信,每个设备在要求传输数据的时候各自建立自己的传输通道,对于其他设备这个通道是封闭的,这样的操作保证了通道的专有性,避免其他设备的干扰。
在传输速率方面,PCI Express总线利用串行的连接特点将能轻松将数据传输速度提到一个很高的频率,达到远超出PCI总线的传输速率。PCI
Express的接口根据总线位宽不同而有所差异,包括x1、x4、x8以及x16(x2模式将用于内部接口而非插槽模式),其中X1的传输速度为250MB/s,而X16就是等于16倍于X1的速度,即是4GB/s。与此同时,PCI
Express总线支持双向传输模式,还可以运行全双工模式,它的双单工连接能提供更高的传输速率和质量,它们之间的差异跟半双工和全双工类似。因此连接的每个装置都可以使用最大带宽,PCI
Express接口设备将有着比PCI设备优越的多的资源可用。
除了这些,PCI
Express设备能够支持热拔插以及热交换特性,支持的三种电压分别为+3.3V、3.3Vaux以及+12V。考虑到现在显卡功耗的日益上涨,PCI
Express而后在规范中改善了直接从插槽中取电的功率限制,16x的最大提供功率达到了70W,比AGP
8X接口有了很大的提高。基本可以满足未来中高端显卡的需求。这一点可以从AGP、PCI
Express两个不同版本的6600GT上就能明显地看到,后者并不需要外接电源。
可以看到PCI Express只是南桥的扩展总线,它与操作系统无关,所以也保证了它与原有PCI的兼容性,也就是说在很长一段时间内在主板上PCI
Express接口将和PCI接口共存,这也给用户的升级带来了方便。由此可见,PCI
Express最大的意义在于它的通用性,不仅可以让它用于南桥和其他设备的连接,也可以延伸到芯片组间的连接,甚至也可以用于连接图形芯片,这样,整个I/O系统将重新统一起来,将更进一步简化计算机系统,增加计算机的可移植性和模块化。PCI
Express已经为PC的未来发展重新铺设好了路基,下面就要看PCI Express产品的应用情况了。