最近面试时遇到一个问题,特意看看有多少人认为CPU的位宽意味着寻址能力,结果发现也有相当一部分人被误导!请注意:2^CPU位宽次方这种计算方法是明显错误的!
系统上也是,一早就有技术支持64G内存,只不过微软为钱,没在32位的桌面级电脑上允许那项功能!
先讲CPU寻址能力!
一般厂商标示多少位CPU是说CPU的运算位宽!
而CPU的位宽一般是以 min{ALU位宽、通用寄存器位宽、数据总线位宽}决定的!也就是说CPU由ALU、通用寄存器、数据总线三者之中最少的位宽决定!所以CPU位宽与其寻址能力并不是挂钩的!
就正如我上边提示过的16位CPU能上1M的内存(这是本人一个笔误,应该是写8086 CPU),1M刚好是20位,这就已经说明CPU位宽与寻址能力不挂钩!
因此某些媒体几年前曾经说过(最近由于与网友中山狐讨论开一些问题而讲起PAE而记起来的),而且在网络上也流传得比较广泛的一个理论:现时CPU都是32位,所以寻址能力是2^32=4G这种说法是明显的错误!
再有!有的媒体曾经说64位CPU最大的好处是支持更大的内存这也是一个典型的错误!在AMD K8时代引入64位后,AMD的U寻址位就达到物理寻址40多位,而INTEL在p4 6系列之后物理寻址寻址能力亦达到40位,这大概是1TB,而如果是64位寻址应该是16EB,所以,以CPU位宽衡量CPU寻址能力是一个典型的错误!
有一个细心的人兄还发现其实我这篇文章中貌似是突出了32位这个词而虚化了CPU这个词!的确,我就是按当年那些文章那种说法而提出这问题的,目的就是想看看多少人被人误导!结果在这贴中也看到比例也不在少数(虽然不占大部分,但是人数也不少!)
事实上CPU寻址能力因每种CPU设计不同而不同!就正如说32位的X86CPU,其实就在PentiumII是引入了36位的扩展PAE机制(Physical Address Extention)地址位来支持64G内存(源于当时服务器的问题),正常情况下也是用32位寻址,但通过设置相应的寄存器(没记错是cr4)的相应位激活PAE就可以支持64位寻址了!
所以,请记住:每个CPU的寻址能力是看其设计的!而单纯以CPU位宽来看待该CPU寻址能力(就是上边红色字的那种寻址能力为2的CPU位宽的次方的说法是错误的!
上边讲到PentiumII通过设置控制寄存器来实现36位寻址,而正常情况下就32位寻址,而且能与前面的架构兼容!
这样不得不惊叹那些硬件设计人员那聪明的脑代,在设计时就想好了可扩充性,在一早就预想到将来会是一个高速、大容量的时代,为当时的奔腾CPU引入了一系列的东西!首先是32位运算能力,另外是为CPU引入32位地址总线,而且还引入MMU(分页单元),使得CPU对物理内存进行段页式管理!这种方式对内存的管理相比于传统方式是更为安全、有效的!而这时,CPU是采用二级分布制:页目录(在线性地址中占10位)->页表(10位)->内存页表页(12位),之后,再在页表项入边才是相应的空间!这样CPU就访问2^10*2^10*2^12=4GB的内存了(嘿嘿,是否有点似曾相识 )!
但因为INTEL面临服务器方面内存容量问题,就开始想办法了,于是,设计师开始想办法,但由于前边那设计的基础,他们很快就想到了,加多一级页表项,并加入相应控制寄存器,对其进行访问控制!这样,就可以对前的架构进行兼容,又能够在特殊情况满足要求哦!这套机制到现时还在用哦,目前最新的X86 CPU(扣肉架构、K8的后代物理寻址大概都在40位左右,但要兼容32位系统,所以还在用这套机制!)。
讲完硬件,当然要讲软件了,系统上一般是如何实现PAE呢,当然对硬件方面那聪明的设计是依样画葫了,最基本的手段是利用二进制在高位上增加0对数的大小是没影响这种想法,在算法上就直接增加位数来页表级数并实现虚存管理(这个与虚拟缓存有关系,但不相同)!然后对利用嵌入汇编对相应寄存器进行判断,一但发现不可用就将相应页置0,嘿嘿,这招好使好用喔!就算64位寻址都通杀!这是最基本的,还有其它方面的一些处理!例如设置一些状态位之类的操作和开了PAE后那些页的数据长度上是有变化的!LINUX内核就采用这种方法的,微软的嘛因为非开源,不知道(即使你知道微软的API,那也仅仅是函数接口,内部实现不可能太清楚)。
再说说关于32位系统开了PAE性能会下降这个话题吧!个人结合看过的相关资料认为:如果是4G以下(包含4G),如果开PAE,内存性能是很有影响的,因为开了PAE,在系统上要加多几级页目录,这样增加了上下文切换,减低性能情况明显!相对地,因为分页单元和CPU是同速率运行,因此影响相对是极少极少的!内存2G比4G差最主要是因为在操作系统上的问题!
源文地址:http://hi.baidu.com/clive_studio/blog/item/cc545dfbebde96d4b48f31b9.html