别出心裁!把GPU当作CPU用又有新突破
利用GPU代替CPU工作,有这种事吗?没错。在2003年,一个来自斯坦福大学的小组发布他们的BrookGPU,这是一款针对图形芯片设计的类似于C语言的编译器和执行系统,该小组指出,通过该系统,NVIDIAGeForceFX5900Ultra运行shader程序性能达到20GFLOPS,这基本和Pentium410GHz处理器的性能相当。
这次,位于美国加州的美国洛斯阿拉莫斯国家实验室(LANL)用汇编语言让GPU通过复杂运算虚拟CPU。
在测试中,图形显示芯片的运算速度比现有CPU的运算速度快12倍。比起2003年的“Pentium410GHz”要高出很多。
显示芯片通过高速计算产生真实而有平滑的三维图象。最新的显示芯片比CPU快出很多,这都要感谢无限大的3D游戏市场需求才让我们拥有如此强大的硬件支持。
LANL的研究员PatrickMcCormick表示在他们刚开始测试GPU的时候,这些芯片一直保持闲置状态,因此它们还有巨大的潜能没有被我们利用到。
McCormick还表示,他们的研究员们能够使用Scout汇编语言来虚拟多种物理现象,例如海啸和银河系。并添加这些运算到显示芯片上,让GPU作虚拟渲染。
为此,LANL的研究员做了两项测试:一是虚拟超巨行星,一是浮点运算测试。在虚拟超巨行星演示中,研究员们虚拟了“超新星核裂变”,GPU在这项测试中的速度高出单CPU的12倍之多!
但是有些科专家认为图形芯片无法运行CPU的一些特殊任务,在诸多电脑运算方面,GPU还没能够被证实能够支持。
超频必备软件:你的CPU真的稳定么?
1、计算高位圆周率的时间有多长
Superπ
Superπ是由日本东京大学金田研究室开发的一款用来计算圆周率的软件,设计者的初衷当初只是在HITACS-3800/480超级计算机上使用,由于在计算π值时,考验到了CPU的多方面计算能力,因此后来被日本的超频爱好者移植到PC上使用,借助Superπ来测试超频后的性能,后来慢慢传入我国,许多硬件实验室也使用这款软件作为测试CPU稳定性的依据。
运行程序时,点击“运行计算”按钮,此时会弹出一个对话框请你选择要运行的圆周率位数,一般采用104万位即可,确认后即可开始运算,很快便可得到结果,时间当然是越短越好。如果你的要求比较高,可以让Superπ运行209万位甚至更高位的运算,这样可以让CPU在更恶劣的条件下满负荷运行,假如能通过3355万次的测试,那么你的系统将可以在任何苛刻环境下稳定运行。
2、我的CPU稳定吗
HotCPUTesterPro
这是一款老牌的测试软件了,利用独特的DefectTech技术而设计,该技术是由OpusWareEnterprise公司开发,主要是通过让CPU长时间进行满负荷运行以提高温度来测试稳定性,从而检测出能够实现超频或者存在缺陷的CPU,如果超频以后的CPU能够?HotCPUTesterPro下稳定运行5个小时以上,那么超频就可以认为是成功的。
1.免费版本的局限性
虽然HotCPUTesterPro总共提供了14个测试项目,但如果你使用的是免费版本,那么将只能完成ComplexMatrix(复矩阵)、CalculatingPi(计算π值)、SortingAlgorithms(分类算法)、PrimeTest(素数测试)、Memory、HD、MMX等项目的测试,如果希望测试FastFourierTransforms(快速Fourier转换)、Chipset、L1Cache、L2Cache、SSE、SSE2、3DNow!等项目,就必须点击“PurchaseHotCPUTesterPro”按钮购买增强版本。
如果你使用的是增强版本,切换到“Options”标签页,可以在这里选择感兴趣的测试项目,而且还可以自由定义更高级的选项。不过,对我们普通用户来说,免费版本提供的功能应该已经足够使用了。
2.测一测系统的稳定性
HotCPUTesterPro提供了运算能力测试、单项测试、性能测试等测试项目,这里进行一下简单介绍。
运算能力测试
运行程序,默认会切换到“Diagnotisc”标签页,我们可以在这里进行运算能力的测试,如图2所示,只要点击“RunTest”按钮就可以开始测试,测试过程中会连续运算各个项目,这一过程中你的CPU使用率将持续保持在100%,这样可以测试CPU的稳定性,同时会产生较大的热量,如果系统能够稳定运行一小时以上,那么就可以认为是合格的。不过,由于测试时CPU的资源占用率保持在100%,因此此时进行任何其他操作都是非常危险的,极有可能导致系统崩溃,测试前最好关闭所有正在运行的程序(包括驻留在系统后台的程序),如果你实在需要同时运行某些程序,请在“Options→HotCPUTester”标签页中将“ProgramPriority(程序优先级)”设置为标准或较低。测试结束后,我们可以在右下角的三个框中看到开始测试和结束测试的时间,时间当然是越短越好。
单项测试
切换到“Buin-in”标签页,这里可以运行CPUBurn-in或MemoryBurn-in等单项测试,允许用户在这里设置测试的次数和测试内存的大小,然后直接点击相应的按钮即可。
性能测试
切换到“Benchmark”标签页,点击“RunBenchmark”按钮即可进行基准测试,测试项目在中间窗口中显示,测试结束后会在“TotalScore”框中显示相应的得分。
查看系统信息
值得一提的是,HotCPUTesterPro还提供了查看系统信息的功能,切换到“SystemInfo”标签页,如图3所示,这里可以查看到包括芯片组型号、主板型号、CPU生产厂商、CPU时钟频率、内存容量、Cache等在内的信息,虽然简单了一些,但都非常准确。另外,这里还可以查看自己的CPU是否支持Multi-ProcessorSystem(多处理器技术)、Hyper-Threadingtechnology(超线程技术)。
3、终极考验
Prime95
Prime95原本是美国数学家和程序设计师乔治。沃特曼、库洛夫斯基共同编制的一款用来寻找梅森最大素数的分布式计算软件,全球的数学爱好者都可以免费下载使用,这就是著名的“GIMPS(因特网梅森素数大搜索项目)”。这个软件的客户端是一个在后台运行的程序,只要一开机就自动运行,不会影响用户的正常工作,由于利用了因特网上大量计算机的闲置时间进行计算,可以获得相当于超级计算机的运算能力。
如果用Prime95来测试系统稳定性的话,将是所有拷机软件中最“残酷”的一款,据说可以发现其他测试软件无法发现的稳定性问题,即使系统能够在Superπ中顺利通过419万次测试,也不见得能够在Prime95中熬过几分钟,因此许多超频玩家都用Prime95作为超频成功的依据。
1.测试之前的配置
进入主界面后,我们首先应该选择“Options→CPU”打开“CPUSettingsandInformation”窗口进行设置,默认设置的时间周期是12小时,从7:30~23:30分,这个时间可实在是太长了,估计能够坚持下来的玩家不会有多少,还是赶快重新更改一下吧。例如我们可以将开始时间设置在下班前,退出时间嘛就随便你了,其实根据笔者的经验,有3~5个小时也就够了。
2.稳定性测试
设置结束后,选择“Options→TortureTest”,此时会弹出图4所示的对话框要求用户选择测试方式,默认选择“Blend”,此时会同时针对CPU和内存进行稳定性测试。或者,你也可以选择“SmallFFTx”或“In-PlaceLargeFFTs”,前者着重测试CPU,测试时可以同时运行其他程序,例如浏览网页、观看视频、运行游戏等;后者着重测试内存,一般不能同时运行其他程序。
点击“OK”按钮,就可以开始进行稳定性测试了,如果你没有选择“In-PlaceLargeFFTs”测试方式,那么Prime95运行时并不会消耗太多的系统资源,我们可以放心的同时进行其他操作。测试过程中,我们可以在系统托盘区看到一个红色的程序图标,如果测试还没有结束时该图标变为黄色,说明测试失败。
3.性能测试
Prime95也提供了性能测试的项目,选择“Options→Benchmark”即可测试系统性能,测试时以运算一定量所花费的时间作为标准,时间当然是越短越好啦。这里要说明的是,由于Prime95的性能测试实在太苛刻,主要是会消耗大量的系统资源,极短时间内即可上升至100%,因此非常容易导致系统死机而无法完成测试,不过即使没有通过测试,其实也并不能代表稳定性存在问题,因为Prime95的工作原理要求CPU的整数运算不能有丝毫的衰减,内存与CPU交换数据的延迟时间必须在一定的范围之内,这样就有可能使得一个稳定的系统无法通过测试。
因此,大多数情况下,我们主要是使用Prime95来测试CPU超频的成功性,至于性能测试倒是其次,建议在无法完成测试的情况下切勿强行测试。
怎么样,看了上面的介绍,你是否也有一种让自己的爱机跃跃欲试的冲动呢?不过,在“极限折磨”你的CPU之前,务必请首先备份好重要的数据哟。
如何降低CPU温度?
网友:我前不久装了一台电脑,具体配置为:AMDAhtonXP2000+CPU、九洲风神998风扇(铜底,4125转/分)、承启7NJL1主板(nForce2,支持333MHzFSB)、两根KingmaxDDR333256MB内存条、希捷酷鱼40GB/7200RPM/2MB硬盘、承启GeForce4MX440/64MBDDR显卡。每次玩《魔兽3》或其它3D游戏时,CPU温度都会升到77℃到81℃,在玩《战地1942》时会有停顿感,刚装机的时候不会出现这种现象。后来我在机箱前后加装了两个散热风扇还是没有效果,温度照样很高。后来我将CPU散热器拆下来清洗了一遍后,温度略降了一点,但是过了两周左右温度又升到77℃到81℃。后来我用软件测试了一下CPU,发现CPU没有超频。请问用什么方法才能把温度降下来?
专家:CPU温度会随着室温和运行时CPU的使用负荷的不同而变化,在运行3D游戏时,CPU温度上升是情理之中的事,就你所说的上升幅度应该还在正常范围内。至于运行《战地1942》会出现停顿现象,估计原因很多,由于《战地1942》是一款对显卡要求较高的游戏,凭GeForce4MX440-8X的“实力”要想能流畅运行还是有难度的,你可以尝试降低显示细节等来解决。从你列出的CPU温度来看似乎有些高,不知道你有没有在CPU散热器和CPU之间涂上导热硅脂?这点十分重要。
CPU领域的摩尔定律详解
在计算机领域有一个人所共知的“摩尔定律”,它是英特尔公司创始人之一戈登?摩尔(GordonMoore)于1965年4月19日提出的。当时发现,微芯片上集成的晶体管数目每12个月就会翻一番。不过当时并没有把这个规律看的很重要,只是当做了一个个人对芯片发展规律的总结。但是后来的发展很好地验证了这一说法,使其享有了“定律”的荣誉。(后来表述为集成电路的集成度每18个月翻一番或者说三年翻两番)
就在摩尔定律提出3年后,英特尔公司诞生了。从它1971年推出第一片微处理器Intel4004至今,微处理器使用的晶体管数量的增长情况基本上符合摩尔定律。有人认为英特尔刻意要求公司的技术发展符合摩尔定律。
时至2002年11月,美国《财富》杂志采访摩尔先生时,年已古稀的摩尔先生说:“开始时Intel公司并没有把摩尔定律作为一个驱动力来看待,说老实话我是直到10~15年前才能启齿用摩尔定律来称呼它的。开始我们只是试图用我们认为合适的方法来推动存储器芯片电路技术的发展,但后来发现,发展几乎总是沿着同一条曲线前进。要说我们真正地刻意按照定律推动技术朝此方向发展那是从最近几代技术才开始的。”
根据新摩尔定律,互联网用户每9个月增加一倍,同时信息流量与带宽也增加一倍。实际上在产业竞争的驱动下,不按这样的速度研发新的产品,企业就有被淘汰的危险。当然英特尔也不例外,Intel之所以成就了今天的成绩,与把摩尔定律写进了公司的发展计划是密不可分的。也许今后摩尔定律会走上两条路,其一就是继续扩大的影响面,使其不仅仅影响半导体业。其二就是摩尔定律在目前半导体工业的转折期内逐步消亡。
CPU风扇和主板不“兼容”
近日,笔者给一个客户安装一台新电脑,机器配置如下:华擎P4VT8+主板、赛扬D2.66GHzCPU、RAMOS256MBDDR333内存、九州风神圣斗士赛扬D专用风扇、奥美嘉FX5700LE显卡、金钻80GB硬盘和世纪冠军天龙电源。装机过程一切顺利,装好WindowsXP后又运行了大约两个小时,没有发现异常现象就将电脑交给了客户。
第二天客户反映电脑不能启动了。我上门检查,发现故障现象较多,且极不稳定。有时系统启动到一半就蓝屏;有时机器无法启动;有时启动成功运行一段时间后又无故死机。我重新启动电脑,按F2键进入BIOS中的“Advanced”设置界面,找到“SystemHardwareMonitor”选项,查看各项电压,完全正常。我怀疑是内存品质不佳导致故障发生,于是在BIOS中将内存频率由“BYSPD”(333MHz)改为266MHz,保存退出重新启动电脑后,运行两个多小时没有出现问题,于是离开。次日客户却将机器抱来公司,说问题还是没解决。
接通电源一试,果然问题依旧。根据启动信息,内存确实是工作在266MHz下。于是换一根金士顿DDR400的内存条试机,故障依旧。升级主板BIOS也没有改观。换华擎P4I45PE-C主板也不行。在多次检查中,重新启动进入BIOS,查看“Advanced”下的“SystemHardwareMonitor”选项时,发现显示CPU风扇转速和各项电压值的参数值不超过30秒就定格了,按Esc键也不能退回到“Advanced”菜单,正常情况应是各项参数不断刷新,且随时可按Esc键退回。
怀疑CPU过热,但“SystemHardwareMonitor”中显示CPU温度才49℃,风扇转速3500转/分左右,都很正常,手摸散热片也只是微温。为了弄清故障源头,笔者几乎将所有硬件(主板、显卡、电源、CPU)统统换了一遍,但故障依然。硬件基本上都换过了,就只剩下风扇了,难道是风扇的问题?随手换上一个酷冷至尊的风扇一试,进入“SystemHardwareMonitor”中,观察了半天,咦!居然正常了!接上硬盘进入系统,一切正常,运行大型游戏,没有任何问题。此后数天,客户反映机器使用正常。
后来我们又做了一个试验,发现只要不插上九州风神的电源插头,只将散热片压在CPU上,也不会出现上述故障(时间长了当然不行)。也许是风扇侦测转速的电路设计和主板不兼容吧。后证实此款(也许是这一批次)风扇只要搭配华擎P4VT8+和P4I45PE-C主板,就会出现这样的问题。
普及讲座--CPU的制作过程详解
现在市场上产品丰富,琳琅满目,当你使用着配置了最新款CPU的电脑在互联网上纵横驰骋,在各种程序应用之间操作自如的时候,有没有兴趣去想一想这个头不大、功能不小的CPU是怎么制作出来的呢。在今天的半导体制造业中,计算机中央处理器无疑是受关注程度最高的领域,而这个领域中众所周知的两大巨头,其所遵循的处理器架构均为x86,而另外一家号称信息产业的蓝色巨人的IBM,也拥有强大的处理器设计与制造能力,它们最先发明了应变硅技术,并在90纳米的处理器制造工艺上走在最前列。在今天的文章中,我们将一步一步的为您讲述中央处理器从一堆沙子到一个功能强大的集成电路芯片的全过程。
制造CPU的基本原料
如果问及CPU的原料是什么,大家都会轻而易举的给出答案—是硅。这是不假,但硅又来自哪里呢?其实就是那些最不起眼的沙子。难以想象吧,价格昂贵,结构复杂,功能强大,充满着神秘感的CPU竟然来自那根本一文不值的沙子。当然这中间必然要经历一个复杂的制造过程才行。不过不是随便抓一把沙子就可以做原料的,一定要精挑细选,从中提取出最最纯净的硅原料才行。试想一下,如果用那最最廉价而又储量充足的原料做成CPU,那么成品的质量会怎样,你还能用上像现在这样高性能的处理器吗?
除去硅之外,制造CPU还需要一种重要的材料就是金属。目前为止,铝已经成为制作处理器内部配件的主要金属材料,而铜则逐渐被淘汰,这是有一些原因的,在目前的CPU工作电压下,铝的电迁移特性要明显好于铜。所谓电迁移问题,就是指当大量电子流过一段导体时,导体物质原子受电子撞击而离开原有位置,留下空位,空位过多则会导致导体连线断开,而离开原位的原子停留在其它位置,会造成其它地方的短路从而影响芯片的逻辑功能,进而导致芯片无法使用。这就是许多NorthwoodPentium4换上SNDS(北木暴毕综合症)的原因,当发烧友们第一次给NorthwoodPentium4超频就急于求成,大幅提高芯片电压时,严重的电迁移问题导致了CPU的瘫痪。这就是intel首次尝试铜互连技术的经历,它显然需要一些改进。不过另一方面讲,应用铜互连技术可以减小芯片面积,同时由于铜导体的电阻更低,其上电流通过的速度也更快。
除了这两样主要的材料之外,在芯片的设计过程中还需要一些种类的化学原料,它们起着不同的作用,这里不再赘述。
CPU制造的准备阶段
在必备原材料的采集工作完毕之后,这些原材料中的一部分需要进行一些预处理工作。而作为最主要的原料,硅的处理工作至关重要。首先,硅原料要进行化学提纯,这一步骤使其达到可供半导体工业使用的原料级别。而为了使这些硅原料能够满足集成电路制造的加工需要,还必须将其整形,这一步是通过溶化硅原料,然后将液态硅注入大型高温石英容器而完成的。
而后,将原料进行高温溶化。中学化学课上我们学到过,许多固体内部原子是晶体结构,硅也是如此。为了达到高性能处理器的要求,整块硅原料必须高度纯净,及单晶硅。然后从高温容器中采用旋转拉伸的方式将硅原料取出,此时一个圆柱体的硅锭就产生了。从目前所使用的工艺来看,硅锭圆形横截面的直径为200毫米。不过现在intel和其它一些公司已经开始使用300毫米直径的硅锭了。在保留硅锭的各种特性不变的情况下增加横截面的面积是具有相当的难度的,不过只要企业肯投入大批资金来研究,还是可以实现的。intel为研制和生产300毫米硅锭而建立的工厂耗费了大约35亿美元,新技术的成功使得intel可以制造复杂程度更高,功能更强大的集成电路芯片。而200毫米硅锭的工厂也耗费了15亿美元。下面就从硅锭的切片开始介绍CPU的制造过程。
单晶硅锭
在制成硅锭并确保其是一个绝对的圆柱体之后,下一个步骤就是将这个圆柱体硅锭切片,切片越薄,用料越省,自然可以生产的处理器芯片就更多。切片还要镜面精加工的处理来确保表面绝对光滑,之后检查是否有扭曲或其它问题。这一步的质量检验尤为重要,它直接决定了成品CPU的质量。
新的切片中要掺入一些物质而使之成为真正的半导体材料,而后在其上刻划代表着各种逻辑功能的晶体管电路。掺入的物质原子进入硅原子之间的空隙,彼此之间发生原子力的作用,从而使得硅原料具有半导体的特性。今天的半导体制造多选择CMOS工艺(互补型金属氧化物半导体)。其中互补一词表示半导体中N型MOS管和P型MOS管之间的交互作用。而N和P在电子工艺中分别代表负极和正极。多数情况下,切片被掺入化学物质而形成P型衬底,在其上刻划的逻辑电路要遵循nMOS电路的特性来设计,这种类型的晶体管空间利用率更高也更加节能。同时在多数情况下,必须尽量限制pMOS型晶体管的出现,因为在制造过程的后期,需要将N型材料植入P型衬底当中,而这一过程会导致pMOS管的形成。
在掺入化学物质的工作完成之后,标准的切片就完成了。然后将每一个切片放入高温炉中加热,通过控制加温时间而使得切片表面生成一层二氧化硅膜。通过密切监测温度,空气成分和加温时间,该二氧化硅层的厚度是可以控制的。在intel的90纳米制造工艺中,门氧化物的宽度小到了惊人的5个原子厚度。这一层门电路也是晶体管门电路的一部分,晶体管门电路的作用是控制其间电子的流动,通过对门电压的控制,电子的流动被严格控制,而不论输入输出端口电压的大小。
准备工作的最后一道工序是在二氧化硅层上覆盖一个感光层。这一层物质用于同一层中的其它控制应用。这层物质在干燥时具有很好的感光效果,而且在光刻蚀过程结束之后,能够通过化学方法将其溶解并除去。
光刻蚀
这是目前的CPU制造过程当中工艺非常复杂的一个步骤,为什么这么说呢?光刻蚀过程就是使用一定波长的光在感光层中刻出相应的刻痕,由此改变该处材料的化学特性。这项技术对于所用光的波长要求极为严格,需要使用短波长的紫外线和大曲率的透镜。刻蚀过程还会受到晶圆上的污点的影响。每一步刻蚀都是一个复杂而精细的过程。设计每一步过程的所需要的数据量都可以用10GB的单位来计量,而且制造每块处理器所需要的刻蚀步骤都超过20步(每一步进行一层刻蚀)。而且每一层刻蚀的图纸如果放大许多倍的话,可以和整个纽约市外加郊区范围的地图相比,甚至还要复杂,试想一下,把整个纽约地图缩小到实际面积大小只有100个平方毫米的芯片上,那么这个芯片的结构有多么复杂,可想而知了吧。
当这些刻蚀工作全部完成之后,晶圆被翻转过来。短波长光线透过石英模板上镂空的刻痕照射到晶圆的感光层上,然后撤掉光线和模板。通过化学方法除去暴露在外边的感光层物质,而二氧化硅马上在陋空位置的下方生成。
掺杂
在残留的感光层物质被去除之后,剩下的就是充满的沟壑的二氧化硅层以及暴露出来的在该层下方的硅层。这一步之后,另一个二氧化硅层制作完成。然后,加入另一个带有感光层的多晶硅层。多晶硅是门电路的另一种类型。由于此处使用到了金属原料(因此称作金属氧化物半导体),多晶硅允许在晶体管队列端口电压起作用之前建立门电路。感光层同时还要被短波长光线透过掩模刻蚀。再经过一部刻蚀,所需的全部门电路就已经基本成型了。然后,要对暴露在外的硅层通过化学方式进行离子轰击,此处的目的是生成N沟道或P沟道。这个掺杂过程创建了全部的晶体管及彼此间的电路连接,没个晶体管都有输入端和输出端,两端之间被称作端口。
重复这一过程
从这一步起,你将持续添加层级,加入一个二氧化硅层,然后光刻一次。重复这些步骤,然后就出现了一个多层立体架构,这就是你目前使用的处理器的萌芽状态了。在每层之间采用金属涂膜的技术进行层间的导电连接。今天的P4处理器采用了7层金属连接,而Athlon64使用了9层,所使用的层数取决于最初的版图设计,并不直接代表着最终产品的性能差异。
测试,测试,测试...
接下来的几个星期就需要对晶圆进行一关接一关的测试,包括检测晶圆的电学特性,看是否有逻辑错误,如果有,是在哪一层出现的等等。而后,晶圆上每一个出现问题的芯片单元将被单独测试来确定该芯片有否特殊加工需要。
而后,整片的晶圆被切割成一个个独立的处理器芯片单元。在最初测试中,那些检测不合格的单元将被遗弃。这些被切割下来的芯片单元将被采用某种方式进行封装,这样它就可以顺利的插入某种接口规格的主板了。大多数intel和AMD的处理器都会被覆盖一个散热层。在处理器成品完成之后,还要进行全方位的芯片功能检测。这一部会产生不同等级的产品,一些芯片的运行频率相对较高,于是打上高频率产品的名称和编号,而那些运行频率相对较低的芯片则加以改造,打上其它的低频率型号。这就是不同市场定位的处理器。而还有一些处理器可能在芯片功能上有一些不足之处。比如它在缓存功能上有缺陷(这种缺陷足以导致绝大多数的CPU瘫痪),那么它们就会被屏蔽掉一些缓存容量,降低了性能,当然也就降低了产品的售价,这就是Celeron和Sempron的由来。
在CPU的包装过程完成之后,许多产品还要再进行一次测试来确保先前的制作过程无一疏漏,且产品完全遵照规格所述,没有偏差。
我们希望这篇文章能够为一些对于CPU制作过程感兴趣的人解答一些疑问。毕竟作者水平有限,不可能以专业的水平把制作过程完全展示给您,如果您有兴趣继续钻研,建议您去阅读一些有关集成电路制造的高级教材。
Intel和AMD未来双核心CPU性能初探
我第一次听说有关双核处理器的事是几年前的一次地区研讨会上,当时AnandShimpi简略的提到了使用双核甚至多核处理器的优点。
在最近的十年间,intel和AMD在把握市场和科技发展动向时,是最早得出相同结论的两家公司。比如:现在我们看到的两家公司都不约而同的在研制90纳米制作工艺的双核处理服务器芯片,这就是一个很好的例子。由此可以预见,双核心处理器的研制成功和推向市场,指日可待。正如有一句亘古不变的谚语所说的“人多好办事“。
近来,随着Intel研发出一种叫"Hyperthreading."的新技术,意味着在研制双核处理器历程上又迈进了一步。双核处理器,作为多核处理器的先驱,是在同一个cpu上运行两个处理器。很多业内权威人士由此告诫广大程序设计师,应该开始运用多线程操作来优化和编写程序代码。因为大部分双核心处理器都引入了"Hyperthreading."技术,正如PaulOtellini在最近2004年intel秋季展览会讲话中所说的:“超过90%的HTcapableXeons拥有HyperThreading技术“。
随着双核心处理器一词的公布,论坛会员(甚至在AMDsuite的会员)纷纷使用新词语,并互相纠正有关双核的各种称呼词语。同时也不再使用"2-way,DPor2-processor"来描述双核心处理服务器,而使用"2-Socketconfiguration."来描述。实际上,一个双插座,双核心intel配置处理器有八个逻辑处理器!并且四个物理处理器分布在两个插座上,且都支持HyperThreading技术。超线程应用程序,比如网站,数据库服务器,都需要精心的设计以便利用其他额外的线程,只有这样,程序运行才能更好。
在Day1和Day2Keynote演讲中,有一项非常引人注目的技术叫VanderpoolTechnology或者VT,VT技术即将在各种类型的处理器(包括双核心处理器)上起到非常重要的作用,这种技术使得处理器具有and/or虚拟化技术,正如因特尔公司所说的,使用VanderpoolTechnology技术,我们可以在同一台机器上同时运行两个操作系统。其中一个处理器运行一个操作系统,另一个处理器运行另一个操作系统
众所周知,AMD和INTEL是两个主要的竞争对手。实际上,AMD也有一种非常类似于因特尔Vanderpool技术的技术,这种技术叫"Pacifica."根据AMD透露的有关消息称,使用Pacifica能够运行多个操作系统,并且使用专门的CPU来运行这些操作系统。同时,AMD还向外界透露了一种叫"Presido"的技术,该技术类似于因特尔的LagrangeTechnology(LT)技术。
Intel在双核处理器展览会中展示了两件产品:首先在Day1Keynote里展示了Itanium2系列处理器,接着在Day2Keynote里展示了首次亮相的65纳米工艺移动版处理器Yonah.
我们得到了一份关于Montecito核的详细分析文档。下面你将会看到该核的总体布局。
我们所确切知道的关于Montecito核的参数的在下面列出来了。
代号名称:Montecito
Process:90
功率:100W
主频:1.7GHz
双核,四线程-一个带超线程的Itanium处理器
尽管Montecito双核心处理器能够大大的提高性能但是它仅仅局限于A-0硅片。英特尔非常高兴地声称Montecito能够在一片硅片上使性能提高1.5到2倍,并因此而感到自豪。众所周知,当程序调用更多的线程和使用更多的高效判决法则时平均执行效率将会有进一步的提高。但是有重要的一点是我们要记住的,双核处理器的性能增长不能够超过2倍(相信大家对看到2倍性能提高的情形有着特别深的印象)。因此英特尔似乎正走着稳固的发展步伐。
在Day2Keynote展示的”Yonah”处理器是intel介绍"PersonalParrallelComputin的展览品,"PersonalParrallelComputin“在Day1Keynote曾经介绍过.
很多的应用,比如实时面部识别应用使用当今软件来实现平均需要50gigaflop。英特尔声称即将推出的处理器性能能满足这种庞大的需求。随后,英特尔向我们介绍了一款65纳米工艺的双核心处理器Yonah和Dothan.核。
近期主流CPU购买指南
在论坛里阿当常常看到这样的事情,很多自称是“菜鸟”的网友因为不了解CPU的规格而焦急地在线向大家求助。确实,随着产品的不断分化,处理器市场也变得十分复杂。面对令人眼花缭乱的CPU产品,相信不少消费者心中都存有这样的疑问“究竟哪款产品性价比更高,我应该选择什么样的CPU?”
其实不管CPU、显卡或者主板如何分化,最终也只有高、中、低三个档次的产品,如果掌握了产品结构,那么我们选择起来就容易很多。下面我们将从低至高简要地向大家推荐几款目前处理器中的热点产品,为大家的实际购买提供指导和参考。另外,我们也希望那些自认“菜鸟”的网友不要着急,只要不断了解产品和市场,你们迟早会比现在的老鸟更出色。
无论是从价格还是规格来看,近期上市的几款CeleronD(赛扬D)、Sempron(闪龙)处理器都是新一代低端处理器的代表。过去,Intel在低端处理器的设计上十分保守,进入Socket478平台以来,尽管赛扬处理器的主频一直在提高,但是128KB的二级缓存和仅400MHz的前端总线却严重制约了处理器的性能。赛扬D的出现无疑为赛扬系列处理器带来了前所未有的活力,533MHz前端总线以及256KB的二级缓存使得处理器的性能较上一代赛扬有了很大的提升,价格上赛扬D也与同频率的赛扬处理器基本持平,极大地提升了产品的性价比。
与赛扬D“稳守价格,提高性能”的策略不同,闪龙系列处理器将低价格作为了产品的制胜之道。最初上市的几款闪龙处理器均采用了较为陈旧的Thoroughbred核心,它们在性能上要落后于同标称值的、基于Thorton或Barton核心的AthlonXP处理器。幸好在降低性能的同时闪龙处理器也以极低的价格面向消费者,就以Sempron2200+为例,它在性能上与AthlonXP1800+相仿,但售价仅需380元,这显然对同价位的赛扬1.8G构成了严重的威胁。可惜的是,性能更好的Sempron2400+、2500+、2600+三款处理器由于是新品上市,目前的性价比还不是很突出。
除了以上两大新品系列以外,Intel原本在低端市场的主力赛扬1.8G、2.4G以及AMD方面的Duron1.8G、AthlonXP2000+也仍然具有一定的市场。这些老产品不仅价格低廉、发热量低,同时对老型号主板的良好兼容性也使它们成为预算紧张的用户青睐的对象。
中端市场
到目前为止,中端CPU市场上最受关注的恐怕还是采用Barton核心的AthlonXP2500+处理器。尽管这款处理器在价格上应该划到低端市场,但是出众的性能却在不少中端处理器之上,所以至今仍倍受用户青睐。只可惜由于停产的缘故,眼下市场上AthlonXP2500+的货源急剧萎缩,假货也因此变得更加猖獗,需要购买的消费者一定要注意。另外,Sempron3100+也于近日在市场上露面,这款基于K8内核的闪龙处理器较Athlon64有所简化,除了二级缓存容量减半,对64位处理的支持也被取消。不过凭借内建的内存控制器以及先进的核心架构,Sempron3100+的综合性能还是很不错的。目前Sempron3100+主要以跟主板捆绑的方式进行销售,算下来价格大致在1050-1100元左右,由于是新品上市,价格还不太理想。
相比之下,Intel在中端市场上没有什么大动作,两款基于Northwood核心的P4处理器——P42.0A和P42.4C仍然是中流砥柱。由于这两款处理器大家都非常熟悉了,在此我们就不再赘述。需要提醒大家的是,尽管P42.0A具有更低的价格,但受制于400MHz的前端总线频率,它在性能方面表现一般,如果大家资金不是十分紧张的话,建议选择P42.4C。在近期大幅降价以后,P42.4C的热销也使得货源略显紧张,不过要买到并不困难。
高端市场
随着价格的不断降低,高端处理器目前也是渐入佳境,其中最具代表性的就是P43.0C、3.0E两款处理器。目前P43.0C、3.0E的价格分别为1460元和1450元(以上均指散装),仅比P42.8C贵10元左右,这种价格背景下我们自然选择主频更高的3.0E或3.0C。具体到产品,P43.0C综合性能非常不错,没有明显的缺点。而P43.0E凭借对SSE3指令集的支持以及容量高达1MB的二级缓存,在多媒体性能上显然更胜P43.0C,但CPU的发热量也随之增加。所以到底如何选择还要看大家对多媒体性能的重视程度。
AMD方面,Athlon642800+、3000+两款产品也终于走下神坛。虽然在实际频率上它们不能与P4抗衡,但凭借HyperTransport总线以及超强的内存寻址能力,Athlon64利用较高的执行效率和存储控制带宽弥补了在主频上的不足,在游戏性能上完全有能力与P42.8C、3.0C一较高下。不过由于实际频率较低,2800+、3000+在多媒体方面的表现还是不及同级别的P4处理器;此外,目前64位程序尚未普及也使得Athlon64的真正优势——64位处理功能无从发挥。但总的看来,Athlon64仍然是高端用户的不错选择。
由于我们重视的是性价比,所以如果大家没有特别的性能要求的话,我们不推荐各位购买1500元以上的高端产品。因为从性能上看,那些处理器与下列几款产品并没有拉开实质上的性能差距,但价格却贵了很多,我们实在没有必要为了增加那一点点的性能投入太多资金。
如何识别正品盒装AMDCPU?
今年贵阳暑期的CPU市场最风光的就要属AMD了,而最大红大紫的莫过于盒装AthlonXP2500+,它从600元左右的价格一路上涨了近200元,虽然最近有所回落,但也在750元左右。它昂贵的价格其实是市场供需的紧张造成的,一度的缺货也使一些不法商贩萌生邪念,打起AMD盒装正品的主意,为了保护消费者的权益,笔者整理了一些识别AMD盒装正品的方法,希望用户在购买AMD盒装正品的时候千万擦亮眼睛。
初看起来两者极为相似,但我们也可以左边的假货没有代理商的贴标和AMD暑期活动刮刮卡。另外提醒大家目前在贵阳市场主要是“伟仕”和“神州数码”两大代理商代理的AMD盒装正品,他们提供的质保都是三年。
我们以XP2500+为例,上图中“2500+”下面的字假货明显要细一些,并且“2500+”也有区别,假货的“2500+”使用的是我们一般默认的字体,而正品的“2500+”字体更偏向Arial。
在盒装正品里的随机LOGO标贴上,可以清楚地看到“Athlon”后清晰的“TM”字样,厂商一般都非常注重自己商标的设计和印刷,但制假者往往容易忽略这里的细节。另外AMD的箭头标志,真货是翠绿色,而假货往往印的有所偏差,呈墨绿或其他相似颜色。
其实盒装正品的散热风扇上有防伪标识,防伪标识在风扇轴心上,它可以根据不同的角度产生丰富的色彩变化,而制假者很难达到这种高度。
同时在正品AMDCPU的标签上(上图中正下角)也有2D矩阵防伪码,而目前造假者还很难具备这种防伪技术。另外提醒用户目前在市场上销售的正品AMDXP2500+基板编号为27493,并且它的出厂日期应该是在04年12周以后了,因为近期盒装AMD在国内的销售情况都很不错,不可能出现产品积压等情况,所以用户若发现近期买到的盒装XP2500+是03年或者更早的货,就要考虑是否是广东那边过来的伪盒装了!
要冷静分析!不要盲目购买64位CPU
暑假已经来临,不少学生或者社会人士都会在这个时期为自己增添一台电脑。经过电脑城,我们可以看到,一些商家打着“32位CPU已经过时,64位的时代已经来临,一次到位,免除升级烦恼”这些标语。64位CPU真的是那么强大吗?它是否值得我们购买呢,在这里我们做一些分析。
64位CPU我们常常见到的就是AMD的Athlon64,Athlon64确实具有优势,不算太高的价格,兼容32位的系统,这些优点好像都吸引着我们去购买,Athlon64也被媒体吵得沸沸扬扬,AMD的广告铺天盖地,但是大部分CPU经销商对Athlon64反应却是异常“冷淡”,销售量也不见得很好,这个就应该引起我们的反思,AMD64位处理器是否真是传说中那么好呢?
首先,32位的应用环境已经非常成熟,64位的处理器虽然听起来很好,但是毕竟前景还不明朗,所以经销商不敢贸然出手。32位的处理器有强大的后台支撑,硬件和软件都十分成熟,可以给用户自己选择,而反看64位CPU呢,硬件的选择十分少,驱动程序和兼容性也是问题,最重要就是,现在百分之90的中国人民使用的WINDOWSXP也不支持64位CPU,要等到下一代的WINDOW才支持,现在微软也不过是发表了一个测试版,我们都习惯了WINDOWS的操作,一下子改用其他系统会不习惯,但是如果用WINDOW又发挥不了64位CPU的性能,这确实是一个十分矛盾的问题。
消费者使用64位处理器,要通过什么软件来施展它的威力?这无疑是当前64位系统面临的一个很大尴尬。现在支持64位CPU的软件比较少。据我所知,只有LINUX操作系统和OPEROFFICE这些软件支持,软件的缺乏是64位CPU不能普及的最大原因。
我们使用电脑的主要目的,无非是学习、工作、娱乐这三个方面。但64位系统能给我们带来什么效果?学习方面,我们一般的32位系统已经足够应付所有的教学软件,难道我们要花费大量的金钱去购买一些不断降价又不实用的产品吗?
工作方面,大多的OFFICE软件都不支持64位CPU,为了得到更快的速度而改变软件,得到的只会是工作效率的降低,如果用64位CPU来运行32位的软件,那么就显得大材小用了。
娱乐方面大家也应该看过比较多的评测,在游戏方面,64位的CPU没有给我们的游戏带来任何质的提升,速度也提高不了多少。难道我们花费了大量的金钱,最后得到的就是在别人面前说,我用的是64位的CPU而得到的一些虚荣?
64位的CPU是前途无限的,但是在今天,它还不能普及。毕竟电脑的发展是一个长期的过程,我们观望未来一年,随着软件的增多,硬件的发展,64位CPU会慢慢走近我们的。计算机发展到今天的地步,消费者已经从盲目跟风消费转换到理性消费的程度。
我们要看自己的实际需要来选择合适自己的CPU,64位CPU比较适合一些需要进行大量数据运算的用户以及一些硬件发烧友。如进行数学计算、多维图形处理,这类用户因为要进行大量数据处理,64位CPU会适合他们使用,而一般的学生和家庭用户,我们建议还是选择32位的P4.C4,Athlon这些CPU,等到操作系统、办公软件、娱乐软件成功进入64位时代的时候,才是64位系统普及的真正来临。
CPU插座也添乱-接触不良导致无法启动
一台兼容机无法启动。风扇运转正常,CPU温度也不高,更换内存条也试过,不能解决问题。
从朋友那里借来一台配置差不多的电脑,用替换法进一步查找故障。更换CPU后,机器启动正常,运行测试程序三个小时也没出现不稳定的现象,我还以为是自己的CPU损坏了。但是,我电脑上的CPU风扇运转一直很正常,CPU也未超频使用,实在没有烧CPU的理由,因此顺手将我的CPU插在朋友的机器上。开机后一切正常,运行也很稳定。
这就怪了,CPU和主板都没有问题,但我这块主板却无法认我原来的CPU。于是仔细观察两块CPU,但好像并没有发现有什么不同。这时忽然看到CPU的针脚上有轻微的夹痕。随即想起,是不是由于CPU插座和CPU针脚之间的接触不良造成的故障。可是CPU插座有478个脚,是哪个脚接触不良呢?考虑到朋友的那块CPU能在我的机子上正常运行,这种接触不良应该是比较轻微的,于是将我的CPU插入CPU插座内,同时轻轻下压CPU插座上的扳手,当感觉拔插CPU有了一定阻力时,将CPU强行从插座中拔出(这一动作有一定危险性,注意插座扳手不可压得太紧,拔CPU时要垂直向上用力,否则CPU针脚弯了就很麻烦了)如此重复几次,再重新装入CPU,扣上风扇,开机后,一切正常。
故障分析:由于CPU针脚上镀有金,同时按Intel的要求,CPU插座上也需要镀金,由于黄金导电性能好,不易氧化,所以CPU和插座间并不容易出现接触不良的情况。但随着市场价格竞争的激化,有不少主板上的CPU插座并没有镀金,或者镀金的厚度低于Intel所要求的厚度,因此在使用中,随着时间的推移,CPU插座易产生一层氧化层,使CPU和插座间出现接触不良,导致机器死机等情况。而我使用的方法也就是让CPU针脚与插座进行摩擦,从而破坏插座上的氧化层,这样就可以使CPU和插座间的接触尽可能变好。
但这一方法始终是治标不治本的,因此在选购电脑时买一款优质主板才是一劳永逸的好办法。另外大家需要注意的是,当怀疑CPU插座接触不良时,千万不要使用除锈液,因为除锈液一般都有一定的腐蚀性,同时还有一定的导电性,因此乱用除锈液有可能造成你主板的彻底烧毁。
谈CPU缓存与CPU性能的关系
说到CPU,不得不说的就是CPU缓存,目前CPU的缓存已经成了衡量CPU性能的一个必要指标,那么CPU缓存到底对CPU性能的影响有多大呢?
我们知道,CPU执行指令时,会将执行结果放在一个叫“寄存器”的元件中,由于“寄存器”集成在CPU内部,与ALU等构成CPU的重要元件,因此寄存器中的指令很快被CPU所访问,但毕竟寄存器的容量太小,CPU所需的大量指令和数据还在内存(RAM)当中,所以CPU为了完成指令操作,需要频繁地向内存发送接收指令、数据。
由于内存的处理速度远远低于CPU,所以传统的系统瓶颈在这里就产生了,CPU在处理指令时往往花费很多时间在等待内存做准备工作。
为了解决这个问题,人们在CPU内部集成了一个比内存快许多的“Cache”,这就是最早的“高速缓存”。
L1高速缓存是与CPU完全同步运行的存储器,也就是我们常说的一级缓存,如果CPU需要的数据和指令已经在高速缓存中了,那么CPU不必等待,直接就可以从一级缓存(L1)中取得数据,如果数据不在L1中,CPU再从二级缓存(L2)中提取数据,大大提高了系统的工作效率。
趣谈CPU缓存工作原理
没有CPU缓存前
我们可以形象地把CPU的运算单元想象成是一间坐落在城市中心的工厂,把内存看成是工厂设置在郊区的一间面积很大的仓库A。
工厂生产所需要的原材料每次都要花时间去远处的仓库A调运,而且到达仓库后,还要等待仓库准备好材料,中间浪费了不少时间。这就是CPU频率未变的情况下,CPU与内存的数据交换不同步的现象。
而突然有一天,由于资金短缺,仓库A从近郊区“搬到”了远郊区,这样原料和成品在工厂与仓库A之间的运输所花费的时间就更长了,工厂生产所需的原料供应不足,经常处于空运转的状态下。这就是说当CPU频率增加后,CPU与内存交换数据等待需时间会变得更长。
增加L1Cache
要解决CPU与内存交换数据不同步这个系统瓶颈问题,其中一个办法是在靠近工厂的市区设置一个小型的仓库B(L1Cache)。
平时把生产最迫切需要、用得最多的原材料(指令和数据)从仓库A(内存)调配到仓库B(L1Cache),这样工厂生产所需要的原材料就可以很快地调配过来,减少空运转的时间。当所需的原材料在仓库B中找不到(缓存未命中)时,仍然要到仓库A(内存)里调配,虽然无可避免地使工厂又进入空运转,或部分空运转(CPU等待若干个时钟周期),但这样毕竟使等待时间大大降低了。
小知识:缓存有一个“预读”功能,也就是可以通过一定的算法,猜测接下来所要的数据,并预先取入缓存。
再添L2Cache
随着CPU的频率提高,与内存之间交换数据不同步的现象更明显了,可以理解为仓库A(内存)搬离郊区,迁到更远的地方了。解决这一问题的一个更好的办法就是在城市的边缘再设立一个比仓库B大的仓库C,也就是我们说的二级缓存。
它的作用是把郊区之外的仓库A(内存)中最迫切用的材料(指令)运到仓库C,而工厂如果在仓库B中找不到所需的材料,就可以到仓库C中找,而不必老远跑到仓库A那里找,节省了不少时间。
通常情况下,L2包括L1所有的数据,另外还有一些附加的数据。换言之,L1与L2、L2与内存之间是子母关系,所以CPU缓存的出现更有效地解决了CPU空等待所造成的资源浪费问题。
CPU缓存越大越好?
当然,CPU缓存并不是越大越好,因为缓存采用的是速度快、价格昂贵的静态RAM(SRAM),由于每个SRAM内存单元都是由4~6个晶体管构成,增加缓存会带来CPU集成晶体管个数大增,发热量也随之增大,给设计制造带来很大的难度。所以就算缓存容量做得很大,但如果设计不合理会造成缓存的延时,CPU的性能也未必得到提高。
反对超频的10大理由
理由之一:超频有碍系统稳定!不可否认,超频对系统性能的提升,但使用者能明显的感受到。更不能不承认,超频对系统稳定性的影响,使用者就不仅仅是感受到了。那就真正的与计算机融为了一个有机的整体。由于超频CPU,显卡(至少我们只能超这两大设备)对电源,主板,甚至操作系统都要有一个严格的考核过程,在这个过程中,更多的则是如何去把计算机从超频的失败中解救出来。根据调查发现,多数的硬件损坏和40%的文件丢失,均是由于超频的不稳定导致的,因此,仅从这个角度出发,超频是不适合我们这些普通电脑玩家的!
理由之二:机器已经很好了!随着时代的发展,It领域中硬件的发展比软件的发展要快上很多,如果非要给个数字的话,我宁愿相信是2倍以上。举个简单的例子,奔腾四1。6G和奔腾四2。3G,同样的GF3显卡,跑同样的反恐精英,英雄萨母,Quake3,虚幻2002会有很大区别吗?当然会有!但这绝非是你能感觉出来的。根据生理特征,每秒100贞和每秒110贞是没有什么区别的,普通人根本不需要理会。更何况,在游戏中,您是更注意游戏娱乐还是FPS有多少呢?因此,从这个角度出发,超频是不合适我们这些普通游戏玩家的!
理由之三:超频会减少硬件使用寿命!不要以为我在危言耸听。在电流密度很高的导体上,最典型的就是积体电路(IC)内部的金属导线,电子的流动会带给上面的金属原子一个动量,使得金属原子有脱离表面的趋势,而当环境温度提高之后,热量会使得金属原子振动加剧,到达一定程度就会离开原位四处流窜,并在能量耗损后被另一处金属表面俘获。这种现象不断发生,结果就导致金属表面上形成坑洞或土丘。这是一种不断演变的慢性过程,一旦情况严重,到最后会造成电路短路,使整个CPU宣布报销。
理由之四:内部损坏我们看不到!我记得制作CPU的材料是Si,SI是很稳定的化学元素,它是不会因为100℃的“高温”而被烧毁的,所谓cpu烧了,就是说高热导致的电子迁移令CPU内部电路短路而无法使用。如今的高主频CPU,为了把CPU的diesize缩小,IC越做越小,线路做的越细越薄,如此,线路的电流强度就变的很大,所以电子的流动所带给金属原子的动量就变的很显著,金属原子就容易从表面脱离而四处流窜,那么电子迁移的现像就是更为严重。并且更重要的是,温度是令电子迁移更为迅速的条件之一,这就是AMD公司不建议消费者超频的主要原因之一!当然啦,内部的损坏我们自然就看不到,有什么化学变化甚至物理变化我们也难以发现。真到烧了的时候,后悔莫及有用吗?
理由之五:没有一个标准指引我们!众所周知,AMD、INTEL、VIA等众多厂商都是非常反对超频行为的。你见过哪个芯片组或者CPU大厂大张旗鼓的宣扬自己的CPU好超吗?当然没有!想超高频就必须提高电压,这时候问题就来了,到底提高多少才合适?20%以内?这只是经验之谈,大多数人在这个范围内成功了,但是总有一些倒霉的人闻到了烧焦的味道!更有一些粗心的人常常在超频的时候把电压调错了,于是仍然闻到了焦味。
理由之六:软件优化更胜一筹!玩过FPS类游戏的人都知道,比如像反恐精英,雷神III这样的游戏,我们这些不太专业的玩家,也知道30FPS和99FPS之间有多大差别!举个最常见的例子来说吧!前不久倚天硬件流行玩反恐精英,可是FPS值普遍在30~40FPS左右。那些人都是用上了宽带的大土豪,机器配置自然无须置疑。为了让更多的人享受游戏,大家就开始找资料进行软件优化。在进行一番优化后,FPS基本稳定在了99,机器稍微差一点的,FPS也在60~70之间。这足以说明,软件对操作系统效率的提高,是有极大帮助的,这并不次于超频。并且,它真的很安全!
理由之七:风险+投资=投资+效果。哪个更合适呢?好的散热设备增加的投资是不是可以买个更高主频的CPU呢?比如XP1800+的价格是620,XP2000的价格是840。差价是300元!我们来算这样一笔帐,150元来买好的优质的散热设备。多100元买有益于超频的主板,再多50购买大功率电源!钱是差不多够用了,可是其中的风险又值多少钱呢?偷鸡不成,到时候机器烧了,主板废了,那上火劲是吃几天药就能好的吗?这难道不是一种合理的投资方式吗?
理由之八:目前市场上显卡的等级差异比较明显。TNT2和GF4系列并存的现象已经有一阵了。其中,显卡的性能逐渐已成为一个热点问题。从表面上来看,显卡超频的确是件百利无一害的事情。试图以改变显卡的核心与显存的工作频率来提高显卡的整体性能。但是,欲提高显卡性能的机器配置自然是个问题。举个例子吧!谁现在还会用奔腾四2。3G+TNT2这样的组合方式?那么,较早配机的用户的CPU与显卡则在一个档次上!根据CPU不能超频的法则来看,显卡超频只是一个多余的行为罢了。
理由之九:显卡超频危险性并不小于超频CPU>的危险性。由于显卡是采用PCIAGP插槽工作方式,因此如果显卡核心烧毁,会直接导致其临近的板卡设备烧毁。一般主板烧毁都是因为插槽虚连、板卡损坏造成的。如果因超频造成重大的经济损失,那超频的确是一个得不偿失的办法!理由一○:由于显卡更具有其独特的专业性质。在办公的环境下,GF4和GF2没有什么显著的区别;而在3D游戏下,速度与画质也就随着显卡档次的提升而逐渐明显起来。这就需要我们在选购显卡之前搞清楚自己到底需要什么,而不是随便挑选一款显卡拿回家盲目的超频以提高显卡工作能力。
理由之十:超频并不能带来多少效能的提高。我并不否认超频会提高显卡的性能,但是这个提高的价值是很低很低的。为什么现在不买杂牌的显卡?原因就是显卡不能工作在稍微高一点的工作频率上!现在还有试图超频杂牌垃圾显卡以节省购买名牌正品显卡的人吗?很显然,没有人会这样做!
综上所述,超频带来的后果远远不止是眼前的死机,蓝屏等。当然了,我们作为DIYER并不是彻底的封杀超频的行为。识实务者为俊杰。如今CPU、显卡如此之强劲,瓶颈早已不在这二位身上,我们又何必卖孩子买猴DDD图乐呵呢?更何况,适时造英雄,现在没有让你当英雄,你又何必拿着几分几秒的Superπ来显摆呢?至此,我的观点大家了解了,不求您去做,但求您了解!
顺便解释几个常识性问题:
a。超频后的CPU发热量必然会增大,这与给它加不加电压毫无关系。
b。如果温度渐次升高的话,电子(热)迁移现象的增强会呈几何级数激增,因此在高温的情况下,电路中的电子(热)迁移现象会尤其明显
c。超频使用CPU的话,电路中的电流密度会成倍增强
d。大多数的电气设备的寿命与其所使用的绝缘材料的耐热性能及绝缘强度有关,CPU也不例外
e。超频后的CPU发热量必然会增大,这与给它加不加电压毫无关系。
f。“超频只不过是让这些CPU“还原”成原来的工作主频”是一个超级缪论!
g。自己要多动脑筋,不要看别人超频就追星!
真假难辩!AMD假CPU大量涌现市场
引言:
目前我们接到确切消息,市场中所出售的AMD中端型号产品,大部分属于假货,其中以Barton2500+最多,而这些假货从表面上与实际测试中与真货根本没有任何区别,使得经销商乃至消费者无从辨认......。
落后:早先的改造方式
记得前一段时间市场中的假Barton2500+只是,简单的使用银漆将L2金桥连上,就可以打开屏蔽的256KB缓存,将一块Thorton核心XP2000+改为Barton2500+,然后通过用易碎标签盖住修改过的部分,就可以按照正常的Barton2500+售出。
难以分辨:工厂级的修改方式
现在市场中所流通的Barton2500+,据传说是经过了新加坡一家专业工厂修改,根本无法从上述几点中判断是否属于假货,而对这些假CPU,AMD专业代理商与经销商是怎么看待的呢?带者一些疑问笔者走访了中关村几家AMDCPU大代理商:让我们一起来看看他们对这些问题的一些解释。
市场流通三种CPU
目前市场中单就Barton2500+而言,存在着三中不同的版本,第一:“真货”这种CPU的价格往往较高,2500+现在需要615元,而很多的假2500+的价格只要570元,45元的差价对于一个普通装机商来说,利润很大的,毕竟一台机器所赚的钱只有100元左右,所以经营这类CPU的经销商普遍反映销路并不是很好。
第二:“超频修改的假货”这类CPU是通过先前的连接金桥而达到修改的目的,但目前消费者对这类假货的认识程度已经很深了,一般人通过肉眼就可以辨别出真假,所以说这类CPU在时常中已经很少可以看到。
第三:“白版CPU”这类CPU是最近才正式流通市场的,但“白版”这个词不同的经销商有不同的说法.
恐怖-连经销商都无法识别的假CPU?!
围绕AMD假CPU的消息在近几年从来没有中断过,近日,笔者了解到,造假者的手段再度升级,一种被经销商叫做“白版”的CPU大量进入市场,据了解,这种假CPU没有任何显著的特性,常用的手段基本无法识别。
何为“白版”CPU?
熟悉AMDCPU的用户都知道,在AMDCPU上有一些被称为金桥的金属点,实际上,这些金属点就是设定CPU主频的跳线,通过不同的断开或连通的设置,就可以实现对CPU倍频的一种设定。而正是因为AMDCPU的这种倍频设置方式,给JS们创造了不少造假的机会。
多年销售CPU的商家看到这颗CPU说“金桥、编号都没有问题,这样的假CPU根本无法识别”
在过去相当长的时间里,AMDCPU的造假,只是通过各种手段,从外部实现对倍频的修改,然而白版CPU却从一开始就拥有着非法移民一般的身份。
白版CPU最初是从AMD正规工厂淘汰下来的次品,而这时它们还没有被锁定金桥,也就是说,这里的CPU还没有安置金桥。之后,这种CPU被一些不正规的渠道所得,流入到一些不法的厂商手中。他们通过对这些CPU进行测试,确定每颗CPU所能达到的最高主频,再采用与AMD正规工厂相同的技术进行切割,从而设定CPU的倍频,最终以正品的身份流入到市场中。
这种CPU从出厂到上市均采用非常规手段,由于最初的成本就很低,所以这类CPU的价格也比正品CPU要低出不少。更重要的是,这类CPU由于在出厂时,AMD还没来得及进行任何具有防伪意义的标识,所以加工厂可以进行辙底的模仿,而相同的切割工艺,使用户唯一的识别手段也被封杀了。
白版CPU唯一的防范手段就是找正规的经销商,然后再用超频进行试验,这两点正是白版CPU最大的两个弱点。首先,由于采用了非正规渠道,这类CPU不管明目张胆的找正规经销商进行销售,大多为一些投机商进行销售。其次,为了追求最大化利润,这类CPU在设定时,采用的是其最高的可工作主频,因此其超频空间微乎其微,与AMD常规的CPU相比有很大的差距。
漫谈CPU缓存的巨大作用
高速缓冲存储器Cache是位于CPU与内存之间的临时存储器,它的容量比内存小但交换速度快。
在Cache中的数据是内存中的一小部分,但这一小部分是短时间内CPU即将访问的,当CPU调用大量数据时,就可避开内存直接从Cache中调用,从而加快读取速度。由此可见,在CPU中加入Cache是一种高效的解决方案,这样整个内存储器(Cache+内存)就变成了既有Cache的高速度,又有内存的大容量的存储系统了。
Cache对CPU的性能影响很大,主要是因为CPU的数据交换顺序和CPU与Cache间的带宽引起的。
高速缓存的工作原理
1、读取顺序
CPU要读取一个数据时,首先从Cache中查找,如果找到就立即读取并送给CPU处理;如果没有找到,就用相对慢的速度从内存中读取并送给CPU处理,同时把这个数据所在的数据块调入Cache中,可以使得以后对整块数据的读取都从Cache中进行,不必再调用内存。
正是这样的读取机制使CPU读取Cache的命中率非常高(大多数CPU可达90%左右),也就是说CPU下一次要读取的数据90%都在Cache中,只有大约10%需要从内存读取。这大大节省了CPU直接读取内存的时间,也使CPU读取数据时基本无需等待。总的来说,CPU读取数据的顺序是先Cache后内存。
2、缓存分类
前面是把Cache作为一个整体来考虑的,现在要分类分析了。Intel从Pentium开始将Cache分开,通常分为一级高速缓存L1和二级高速缓存L2。
在以往的观念中,L1Cache是集成在CPU中的,被称为片内Cache。在L1中还分数据Cache(I-Cache)和指令Cache(D-Cache)。它们分别用来存放数据和执行这些数据的指令,而且两个Cache可以同时被CPU访问,减少了争用Cache所造成的冲突,提高了处理器效能。
在P4处理器中使用了一种先进的一级指令Cache——动态跟踪缓存。它直接和执行单元及动态跟踪引擎相连,通过动态跟踪引擎可以很快地找到所执行的指令,并且将指令的顺序存储在追踪缓存里,这样就减少了主执行循环的解码周期,提高了处理器的运算效率。
以前的L2Cache没集成在CPU中,而在主板上或与CPU集成在同一块电路板上,因此也被称为片外Cache。但从PⅢ开始,由于工艺的提高L2Cache被集成在CPU内核中,以相同于主频的速度工作,结束了L2Cache与CPU大差距分频的历史,使L2Cache与L1Cache在性能上平等,得到更高的传输速度。
L2Cache只存储数据,因此不分数据Cache和指令Cache。在CPU核心不变化的情况下,增加L2Cache的容量能使性能提升,同一核心的CPU高低端之分往往也是在L2Cache上做手脚,可见L2Cache的重要性。现在CPU的L1Cache与L2Cache惟一区别在于读取顺序。
3、读取命中率
CPU在Cache中找到有用的数据被称为命中,当Cache中没有CPU所需的数据时(这时称为未命中),CPU才访问内存。从理论上讲,在一颗拥有2级Cache的CPU中,读取L1Cache的命中率为80%。也就是说CPU从L1Cache中找到的有用数据占数据总量的80%,剩下的20%从L2Cache读取。由于不能准确预测将要执行的数据,读取L2的命中率也在80%左右(从L2读到有用的数据占总数据的16%)。那么还有的数据就不得不从内存调用,但这已经是一个相当小的比例了。在一些高端领域的CPU(像Intel的Itanium)中,我们常听到L3Cache,它是为读取L2Cache后未命中的数据设计的—种Cache,在拥有L3Cache的CPU中,只有约5%的数据需要从内存中调用,这进一步提高了CPU的效率。
为了保证CPU访问时有较高的命中率,Cache中的内容应该按一定的算法替换。一种较常用的算法是“最近最少使用算法”(LRU算法),它是将最近一段时间内最少被访问过的行淘汰出局。因此需要为每行设置一个计数器,LRU算法是把命中行的计数器清零,其他各行计数器加1。当需要替换时淘汰行计数器计数值最大的数据行出局。这是一种高效、科学的算法,其计数器清零过程可以把一些频繁调用后再不需要的数据淘汰出Cache,提高Cache的利用率。
缓存技术的发展
总之,在传输速度有较大差异的设备间都可以利用Cache作为匹配来调节差距,或者说是这些设备的传输通道。在显示系统、硬盘和光驱,以及网络通讯中,都需要使用Cache技术。但Cache均由静态RAM组成,结构复杂,成本不菲,使用现有工艺在有限的面积内不可能做得很大,不过,这也正是技术前进的源动力,有需要才有进步!
锋利的双刃剑全面认识CPU的流水线
Prescott核心的Pentium4处理器系列上市之初就受到了各方的质疑,因为相比上一代Northwood核心Pentium4处理器的20级流水线,新Pentium4处理器的流水线达到了创记录的31级!究竟什么是流水线,为什么新Pentium4处理器会采用超长流水线,它有什么样的负面影响呢?
一、我们为什么需要流水线?
借鉴了工业流水线制造的思想,现代CPU也采用了流水线设计。在工业制造中采用流水线可以提高单位时间的生产量;同样在CPU中采用流水线设计也有助于提高CPU的频率。先让我们以汽车装配为例来解释流水线的工作方式。假设装配一辆汽车需要4个步骤:1.冲压:制作车身外壳和底盘等部件,2.焊接:将冲压成形后的各部件焊接成车身,3.涂装:将车身等主要部件清洗、化学处理、打磨、喷漆和烘干,4.总装:将各部件(包括发动机和向外采购的零部件)组装成车;同时对应地需要冲压、焊接、涂装和总装四个工人。如果不采用流水线,那么第一辆汽车依次经过上述四个步骤装配完成之后,下一辆汽车才开始进行装配,最早期的工业制造就是采用的这种原始的方式。
不久之后大家就发现,某个时段中一辆汽车在进行装配时,其它三个工人处于闲置状态,显然这是对资源的极大浪费!于是大家开始思考能有效利用资源的方法:有什么办法让四个工人一起工作呢?那就是流水线!在第一辆汽车经过冲压进入焊接工序的时候,立刻开始进行第二辆汽车的冲压,而不是等到第一辆汽车经过全部四个工序后才开始。之后的每一辆汽车都是在前一辆冲压完毕后立刻进入冲压工序,这样在后续生产中就能够保证四个工人一直处于运行状态,不会造成人员的闲置。这样的生产方式就好似流水川流不息,因此被称为流水线。
CPU的工作我们也可以大致分为指令的获取、解码、运算和结果的写入四个步骤,采用流水线设计之后,指令(好比待装配的汽车)就可以连续不断地进行处理。在同一个较长的时间段内,显然拥有流水线设计的CPU能够处理更多的指令。
二、为什么要加长流水线?
Intel和AMD在桌面CPU市场上的激烈竞争,使双方都千方百计地拿出更强大产品来压制对方,而最引人瞩目的就是CPU的频率之争。随着CPU频率不断地攀升,Intel总是在自己某个核心的处理器到达极限之时采用新的、更长流水线的核心来消除频率的瓶颈。那么流水线和频率之间有什么关系呢?
还是以上面的例子来说明。假如冲压、焊接、涂装和总装四个过程各自需要1个小时,现在我们把这四个工序细化:冲压分为冲压1(外壳)和冲压2(底盘)两个子工序,另外三个工序同样各自分成两个子工序,一共八个子工序。这样一来,完成每个子工序平均只需要半个小时,因此每隔半个小时就有一辆汽车完成装配,下线速度提高了一倍!如果再进一步细化,一分为二,那么完成每个工序平均只需要15分钟,即每隔15分钟就有一辆汽车下线,速度又提高了一倍(单辆汽车的生产时间仍是4个小时,但是两辆汽车的生产间隙更小了)。所以工序分得越细,单位时间内(例如8个小时)生产的汽车就越多。
正是这样,CPU厂商才试图不断加长流水线,以利于频率的提升。那么为什么Prescott核心的处理器才31级流水线,流水线级数能不能无限增长呢?
三、长流水线带来的问题
首先,由于现有芯片制造工艺的限制,频率的提升带来高功耗、高发热量的问题。尽管流水线增长,频率提升的空间相应增大,但是处理器频率提升的其它瓶颈却无法解决。而且过长的流水线意味着更加复杂的内部结构,生产的良品率也难以保证。
其次,在CPU的工作中,指令往往不是孤立的,许多指令按一定的顺序执行才能完成一个任务。而一旦某个指令在运算过程中发生了错误,或者执行了没有用的指令,那么其后与之相关的指令就都没有用了。这些指令必须清除掉,然后再执行其它的指令,CPU相当于做了许多无用功!流水线越长,一旦出错影响也就越大,比如一个指令在最后一级出错,那么可能在后续流水线中的所有指令都要被清除,Northwood核心处理器要浪费20级工序的时间,而Prescott核心处理器就要浪费31级工序的时间!
再者,由于任何电导体都会产生延时,流水线越长、级数越多就会导致延迟次数越多,总延时就越大,CPU完成单个任务的时间就会越长。基于以上两个原因,人们才常常说Prescott核心处理器的效率低下,需要用更大的缓存和更先进的技术加以弥补。因此我们可以看到低频率Prescott核心处理器与同频的Northwood核心处理器相比在性能上比没有什么优势,只有在Prescott核心处理器的频率不断提升之后才能抵消长流水线带来的负面影响并发挥出自身的优势。
浅析CPU芯片散热原理
CPU被设计在-25-90摄氏度的温度范围下工作的(有些CPU最高只到85摄氏度),我们只需要将CPU的温度维持在50度左右就可以保持系统的稳定。对于目前动辄以GHZ来计算的CPU频率,以散热片为代表的被动散热方式显然很难满足CPU的需要,而使用风扇强迫性的吹走散热片热量的主动散热方式才是当务之急。
风扇通过底座上的扣具紧紧的扣在CPU上,当CPU开始发热,CPU的热量(尤其是CPU核芯)通过紧贴在上面的底座传到散热鳍片,鳍片通过周围和由风扇吹来了的冷空气将热量散去。因此要保证CPU的热量能尽快散发,首先需要都的是就是如何将CPU的热量传导到散热器上。这里就要涉及到散热器的导热系数、散热片是否与CPU紧贴等问题。
相对散热器来说,导热系数说白了也就是散热器采用的金属的导热能力,散热器常用铜和铝这两种材质制作散热片。铝材质的优点是成本低、易加工和优良的表面处理性(主要是在散热片表面进行阳极处理,但纯铝很软,需要加入少量其他金属,这样可以极大增加铝的硬度和延展性,但基本不会影响它的导热系数)材质。
不过纯铝的散热片已经不能胜任现在高频率的CPU,散热器厂商逐渐引入了铜材质,铜的导热系数几乎是铝的1倍,但铜的密度大,如果采用全铜散热片,散热器的重量会很沉,成本也高。所以目前市场上的散热器主要还是采用铜铝结合型的散热片,导热效果相当不错。
有了一个好的散热器,并不是能确保有效为CPU降烧。如果不正确使用,你的CPU说不定那天也会香销玉……要想将CPU热量快速传导到散热器上就必须确保散热片与CPU亲密接触。
不开机箱认识自己的CPU
介绍CPU的文章我们做过很多,但对大多数用户来说,却未必有机会把机箱里面的CPU拆出来看看,因此,此次我们就来通过系统以及简单的软件方法了解自己的处理器。
入门篇
如果只想了解自己的CPU型号,WindowsMe/2000/XP这些操作系统都能帮我们完成这个任务。进入Windows后,右键单击“我的电脑”,在弹出菜单中点击“系统属性”,那么新弹出的“系统属性”窗口中就会显示CPU的属性。当系统搭配的早期CPU(主要是在IntelPentiumⅢ以前的CPU)时,这里只会显示CPU的型号。而Intel在新处理器中(后期推出的PentiumⅢ系列处理器以及Pentium4处理器),在CPU内部加入了CPU速度信息,因此现在的CPU检测时还会有后面的2.40GHz字样,这就是这块CPU的标准运行频率。另外,Windows系统属性还能读取CPU的实际运行速度,在CPU下面的3.21GHz就是CPU的实际运行频率。需要知道的是,按道理CPU的实际运行频率与标准运行频率应该一致,但因为各厂家的主板调节频率的方式不一致的原因,这里的频率会有一定的误差。而如果两个频率差别过大,比如图中标准运行频率是2.40GHz,而实际运行频率是3.21GHz,那么你就遇到CPU超频了,而如果这CPU是你按照3.20GHz的型号购买的,那么你就肯定遇到奸商了。当实际频率明显低于标准频率,则说明要么BIOS中CPU型号设置有错,要么你的CPU或者主板有自动降频节能功能,这在笔记本CPU中很常见。
如果用户使用的是AMD系列处理器,也会看到相似的CPU信息,不过如果使用的是AMDAthlonXP系列处理器,则它没有Intel的标准运行频率,只有当前CPU的PR值,而这个值是按照当前的CPU实际运行速度推算出来的,并不是一个固定的信息。因此,我们不能用这个方法来判断AthlonXP处理器是否为Remark。在AMD的64位处理中,AMD也把CPU型号信息固化在CPU中了,可以通过了解此信息来看购买的AMD64位处理器是否为真品。目前,AMD的64位处理器由低到高包括Athlon64、Athlon64FX和Opteron三类。
如果我们留意IntelPentium4处理器的标志,会发现标志的右上角有“HT”字样,这表示这块CPU支持HyperThreading技术,能把一块CPU模拟为两块CPU,提高CPU的使用效率。
那么在使用带有“HT”技术的Pentium4处理器时,如何检测是否成功开启了“HT”技术呢?只要启动Windows2000/XP的任务管理器,然后查看其中的“性能”菜单下的CPU使用记录,如果看到两个CPU使用窗口,就表示成功开启了超线程设置。
晋级篇
如果想了解自己CPU的更多信息,就需要第三方的CPU检测软件了。我们推荐用CPU-Z这款绿色软件(下载地址:http://www.onlinedown.net/soft/2775.htm)。启动CPU-Z,可以看到界面。其中,Name表示CPU型号,如Pentium4或者AthlonXP。CodeName表示CPU的开发代号,如Northwood或者Prescott都是CPU代号。Package表示CPU的接口和封装方式,如Socket478、SocketA、LGA775等。Technology就是CPU制造工艺,现在多为0.13微米或0.09微米。Voltage就是CPU的工作电压。Specification则是CPU的型号全称,相当于Windows中检测出的CPU属性。Family和Ext.Family这几项都表示的CPU的批次和改进编号。我们主要注意的应该是Revision这个编号,这表示同一制造工艺下CPU的不同改进版,一般这个编号每更新一次,就表示CPU生产中遇到的BUG大量修正一次,CPU制造工艺又提高一个等级。比如购买赛扬D处理器时,我们会说D0版本比C0版本超频能力更好,这个D0或者C0版本号就是在这里读取。
Clocks框内就是与CPU有关的各种频率。CoreSpeed就是CPU当前的实际运行频率;Multiploer则是CPU的倍频;FSB就是CPU的前端总线频率(FrontSideBus),CPU的运行频率=倍频×前端总线。BusSpeed则是CPU与芯片组之间的总线频率。最早FSB与BusSpeed频率是一致的,而自Athlon和Pentium4以后,CPU厂家通过分频技术,能够在一个前端总线周期内让CPU和芯片组之间多次交换数据,这样,前端总线与总线频率就成了倍数的关系。比如Pentium4能够在一个FSB周期中与北桥芯片交换4次数据,因此Pentium4的BusSpeed就是FSB×4。这也就解释了很多用户的一个疑问:为什么我们总说Pentium4有800MHz的外频,但在BIOS中调节却只有200MHz的前端总线?因为BIOS的前端总线是通过频率发生器生成的实际频率,而800MHz外频只是一个数据传输的频率。图4中的Cache框中就是CPU的缓存容量,在同样构架下,缓存容量更大的CPU性能也会更高。
最后,了解这么多与自己CPU相关的信息,但我们依然不知道CPU的模样,岂不遗憾?没关系,我们只要联网到能够搜索图片的搜索引擎,比如百度、google,然后按照了解到的CPU开发代号为关键字搜索,那么我们CPU的模样就轻易地能被搜索出来了。