微处理器
微处理器用一片或少数几片大规模集成 电路组成的 中央处理器。这些 电路执行控制部件和 算术逻辑部件的功能。微处理器与传统的 中央处理器相比,具有体积小、重量轻和容易模块化等优点。微处理器的基本组成部分有: 寄存器堆、 运算器、时序控制 电路,以及数据和 地址总线。微处理器能完成取 指令、执行指令,以及与外界 存储器和逻辑部件交换信息等操作,是 微型计算机的运算控制部分。它可与 存储器和外围 电路芯片组成 微型计算机。
中文名
微处理器
外文名
CPU
含 义
计算机的运算核心和控制核心
目录
1内部结构
2发展历程
▪ 第一代 ▪ 第二代 ▪ 第三代 ▪ 第四代
▪ 第五代 ▪ 第六代
3组成
▪ 算术逻辑单元 ▪ 存储器 ▪ I/O接口 ▪ 总线4AMD CPU
▪ K5 ▪ K6 ▪ K6-2 ▪ K6-Ⅲ ▪ Athlon(K7) ▪ Thunderbird(雷鸟)
▪ Duron(毒龙)
5其他微处理器发展
6中国研发
自从人类1947年发明晶体管以来,50多年间半导体技术经历了硅晶体管、集成 电路、超大规模集成电路、甚大规模集成电路等几代,发展速度之快是其他产业所没有的。半导体技术对整个社会产生了广泛的影响,因此被称为“产业的种子”。 中央处理器是指计算机内部对数据进行处理并对处理过程进行控制的部件,伴随着大规模集成 电路技术的迅速发展,芯片集成密度越来越高,CPU可以集成在一个 半导体芯片上,这种具有中央处理器功能的大规模集成电路器件,被统称为“微处理器”。需要注意的是:微处理器本身并不等于微型计算机,仅仅是微型计算机的中央处理器。
微处理器已经无处不在,无论是录像机、智能洗衣机、移动电话等家电产品,还是汽车引擎控制,以及数控机床、导弹精确制导等都要嵌入各类不同的微处理器。微处理器不仅是 微型计算机的核心部件,也是各种数字化智能设备的关键部件。国际上的超高速巨型计算机、 大型计算机等高端计算系统也都采用大量的通用高性能微处理器建造。 [1]
1内部结构
16位微处理器(图中为8086微处理器)可分成两个部分,一部分是执行部件(EU),即执行 指令的部分;另
一部分是 总线接口部件(BIU),与8086总线联系,执行从 存储器取指令的操作。微处理器分成EU和BIU后,可使取 指令和执行指令的操作重叠进行。EU部分有一个 寄存器堆,由8个16位的寄存器组成,可用以存放数据、 变址和 堆栈指针、 算术运算 逻辑单元(ALU)执行算术运算和逻辑操作, 标志寄存器寄存这些操作结果的条件。执行部件中的这些部件是通过 数据总线传送数据的。 总线接口部件也有一个 寄存器堆,其中CS、DS、SS和ES是 存储空间分段的分段寄存器。IP是 指令指针。内部通信 寄存器也是暂时存放数据的寄存器。 指令队列是把预先取来的 指令流存放起来。总线接口部件还有一个地址 加法器,把分段 寄存器值和偏置值相加,取得20位的物理地址。数据和地址通过 总线控制逻辑与外面的8086 系统总线相联系。
微处理器的分类
根据微处理器的应用领域,微处理器大致可以分为三类:通用高性能微处理器、嵌入式微处理器和数字信号处理器、微控制器。一般而言,通用处理器追求高性能,它们用于运行通用软件,配备完备、复杂的操作系统;嵌入式微处理器强调处理特定应用问题的高性能,主要用于运行面向特定领域的专用程序,配备轻量级操作系统,主要用于蜂窝电话、CD播放机等 消费类家电;微控制器价位相对较低,在微处理器市场上需求量最大,主要用于汽车、空调、自动机械等领域的自控设备。 CPU是Central Processing Unit(中央微处理器)的缩写,它是计算机中最重要的一个部分,由运算器和控制器组成。如果把计算机比作人,那么CPU就是人的大脑。CPU的发展非常迅速,个人电脑从8088(XT)发展到现在的Pentium 4时代,只经过了二十一年的时间。
2发展历程
CPU从最初发展至今已经有二十多年的历史了,这期间,按照其处理信息的字长,CPU可以分为:4位微处理器、8位微处理器、16位微处理器、32位微处理器以及最新的64位 微处理器,可以说个人电脑的发展是随着CPU的发展而前进的。微机是指以大规模、超大规模集成 电路为主要部件,以集成了计算机主要部件——控制器和运算器的微处理器MP(Micro Processor)为核心,所构造出的计算系经过30多年的发展,微处理器的发展大致可分为:
第一代
第一阶段
(1971—1973年)通常以字长是4位或8位微处理器,典型的是美国 Intel 4004和Intel 8008微处理器。Intel 4004是一种4位微处理器,可进行4位 二进制的并行运算,它有45条 指令,速度0.05MIPs(Million Instruction Per Second,每秒百万条指令)。Intel 4004的功能有限,主要用于计算器、电动打字机、照相机、台秤、电视机等家用电器上,使这些电器设备具有智能化,从而提高它们的性能。Intel 8008是世界上第一种8位的微处理器。 存储器采用PMOS工艺。该阶段计算机工作速度较慢,微处理器的指令系统不完整, 存储器容量很小,只有几百字节,没有操作系统,只有汇编语言。主要用于工业仪表、过程控制。
第二代
(1974—1977年)典型的微处理器有Intel 8080/8085,Zilog公司的Z80和Motorola公司的M6800。与第一代微处理器相比,集成度提高了1~4倍,运算速度提高了10~15倍,指令系统相对比较完善,已具备典型的计算机体系结构及中断、直接 存储器存取等功能。
由于微处理器可用来完成很多以前需要用较大设备完成的计算任务,价格又便宜,于是各半导体公司开始竞相生产微处理器芯片。Zilog公司生产了8080的增强型Z80,摩托罗拉公司生产了6800,英特尔公司于1976年又生产了增强型8085,但这些芯片基本没有改变8080的基本特点,都属于第二代微处理器。它们均采用NMOS工艺,集成度约9000只晶体管,平均 指令执行时间为1μS~2μS,采用汇编语言、BASIC、Fortran编程,使用 单用户操作系统。
第三代
第三阶段(1978—1984年)即16位微处理器。1978 年,Intel公司率先推出16位微处理器8086,同时,为了方便原来的8位机用户,Intel公司又提出了一种准16位微处理器8088。
8086微处理器最高主频速度为8MHz,具有16位数据通道, 内存寻址能力为1MB。同时英特尔还生产出与之相配合的数学协处理器i8087,这两种芯片使用相互兼容的 指令集,但i8087指令集中增加了一些专门用于对数、指数和三角函数等数学计算的指令。人们将这些指令集统一称之为 x86指令集。虽然以后英特尔又陆续生产出第二代、第三代等更先进和更快的新型CPU,但都仍然兼容原来的x86 指令,而且英特尔在后续CPU的命名上沿用了原先的x86序列,直到后来因商标注册问题,才放弃了继续用阿拉伯数字命名。
1979年, 英特尔公司又开发出了8088。8086和8088在芯片内部均采用16位数据传输,所以都称为16位微处理器,但8086每周期能传送或接收16位数据,而8088每周期只采用8位。因为最初的大部分设备和芯片是8位的,而8088的外部8位数据传送、接收能与这些设备相兼容。8088采用40针的DIP封装, 工作频率为6.66MHz、7.16MHz或8MHz,微处理器集成了大约29000个晶体管。
在Intel公司推出8086、8088 CPU之后,各公司也相继推出了同类的产品,有Zilog公司Z8000和Motorola公司的M68000等。16位微处理器比8位微处理器有更大的寻址空间、更强的运算能力、更快的处理速度和更完善的指令系统。所以,16位微处理器已能够替代部分小型机的功能,特别在单任务、单用户的系统中,8086等16位微处理器更是得到了广泛的应用。
1981年,美国IBM公司将8088芯片用于其研制的IBM-PC机中,从而开创了全新的微机时代。也正是从8088开始,个人电脑(PC)的概念开始在全世界范围内发展起来。从8088应用到IBM PC机上开始,个人电脑真正走进了人们的工作和生活之中,它也标志着一个新时代的开始。
1982年,英特尔公司在8086的基础上,研制出了80286微处理器,该微处理器的最大 主频为20MHz,内、外部数据传输均为16位,使用24位 内存储器的 寻址, 内存寻址能力为16MB。80286可工作于两种方式,一种叫实模式,另一种叫保护方式。
在实模式下,微处理器可以访问的内存总量限制在1兆字节;而在保护方式之下,80286可直接访问16兆字节的内存。此外,80286工作在保护方式之下,可以保护操作系统,使之不像实模式或8086等不受保护的微处理器那样,在遇到异常应用时会使系统停机。
IBM公司将80286微处理器用在先进技术微机即AT机中,引起了极大的轰动。80286在以下四个方面比它的前辈有显著的改进:支持更大的内存;能够模拟内存空间;能同时运行多个任务;提高了处理速度。
最早PC机的速度是4MHz,第一台基于80286的AT机运行速度为6MHz至8MHz,一些制造商还自行提高速度,使80286达到了20MHz,这意味着性能上有了重大的进步。
80286的封装是一种被称为PGA的正方形包装。PGA是源于PLCC的便宜封装,它有一块内部和外部固体插脚,在这个封装中,80286集成了大约130000个晶体管。
IBM PC/AT微机的总线保持了XT的三层 总线结构,并增加了高低位 字节总线 驱动器转换逻辑和高位字节总线。与XT机一样,CPU也是焊接在 主板上的。
第四代
第四阶段(1985—1992年)即32位微处理器。1985年10月17日,英特尔划时代的产品——80386DX正式发布了,其内部包含27.5万个晶体管, 时钟频率为12.5MHz,后逐步提高到20MHz、25MHz、33MHz,最后还有少量的40MHz产品。
80386DX的内部和外部 数据总线是32位, 地址总线也是32位,可以 寻址到4GB内存,并可以管理64TB的 虚拟存储空间。它的运算模式除了具有实模式和保护模式以外,还增加了一种“虚拟86”的工作方式,可以通过同时模拟多个8086微处理器来提供多任务能力。
80386DX有比80286更多的 指令,频率为12.5MHz的80386每秒钟可执行6百万条指令,比频率为16MHz的80286快2.2倍。80386最经典的产品为80386DX-33MHz,一般我们说的80386就是指它。
由于32位微处理器的强大运算能力,PC的应用扩展到很多的领域,如商业办公和计算、工程设计和计算、 数据中心、个人娱乐。80386使32位CPU成为了PC工业的标准。
1989年英特尔公司又推出准32位微处理器芯片80386SX。这是Intel为了扩大市场份额而推出的一种较便宜的普及型CPU,它的内部数据总线为32位,外部数据总线为16位,它可以接受为80286开发的16位输入/输出接口芯片,降低整机成本。80386SX推出后,受到市场的 广泛的欢迎,因为80386SX的性能大大优于80286,而价格只是80386的三分之一。
1989年,我们大家耳熟能详的80486芯片由英特尔推出。这款经过四年开发和3亿美元资金投入的芯片的伟大之处在于它首次实破了100万个晶体管的界限,集成了120万个晶体管,使用1微米的制造工艺。80486的时钟频率从25MHz逐步提高到33MHz、40MHz、50MHz。
80486是将80386和数学协微处理器80387以及一个8KB的高速缓存集成在一个芯片内。80486中集成的80487的数字 运算速度是以前80387的两倍,内部 缓存缩短了微处理器与慢速DRAM的等待时间。并且,在80x86系列中首次采用了RISC( 精简指令集)技术,可以在一个 时钟周期内执行一条指令。它还采用了突发 总线方式,大大提高了与内存的数据交换速度。由于这些改进,80486的性能比带有80387数学协微处理器的80386 DX性能提高了4倍。
第五代
第5阶段(1993-2005年)是奔腾(pentium)系列微处理器时代,通常称为第5代。典型产品是Intel公司的奔腾系列芯片及与之兼容的AMD的K6系列微处理器芯片。内部采用了超标量指令流水线结构,并具有相互独立的指令和数据高速缓存。随着MMX(MultiMediaeXtended)微处理器的出现,使微机的发展在网络化、多媒体化和智能化等方面跨上了更高的台阶。
早期的奔腾75MHz~120MHz使用0.5微米的制造工艺,后期120MHz频率以上的奔腾则改用0.35微米工艺。经典奔腾的性能相当平均,整数运算和浮点运算都不错。 为了提高电脑在 多媒体、3D图形方面的应用能力,许多新指令集应运而生,其中最著名的三种便是英特尔的MMX、SSE和AMD的3D NOW!。 MMX(MultiMedia Extensions,多媒体 扩展指令集)是英特尔于1996年发明的一项多媒体指令增强技术,包括57条多媒体指令,这些指令可以一次处理多个数据,MMX技术在软件的配合下,就可以得到更好的性能。
多能奔腾(Pentium MMX)的正式名称就是“带有MMX技术的Pentium”,是在1996年底发布的。从多能奔腾开始,英特尔就对其生产的CPU开始锁倍频了,但是MMX的CPU超外频能力特别强,而且还可以通过提高核心电压来超倍频,所以那个时候超频是一个很时髦的行动。超频这个词语也是从那个时候开始流行的。
多能奔腾是继Pentium后英特尔又一个成功的产品,其生命力也相当顽强。多能奔腾在原Pentium的基础上进行了重大的改进,增加了片内16KB 数据缓存和16KB 指令缓存,4路写缓存以及 分支预测单元和返回堆栈技术。特别是新增加的57条MMX多媒体指令,使得多能奔腾即使在运行非MMX优化的程序时,也比同主频的Pentium CPU要快得多。
1997年推出的Pentium II 处理器结合了Intel MMX技术,能以极高的效率处理影片、音效、以及绘图资料,首次采用Single Edge Contact (S.E.C) 匣型封装,内建了高速快取 记忆体。这款晶片让电脑使用者撷取、编辑、以及透过 网际网络和亲友分享数位相片、编辑与新增文字、音乐或制作家庭电影的转场效果、使用视讯 电话以及透过标准电话线与网际网络传送影片,Intel Pentium II处理器晶体管数目为750万颗。
Pentium III 处理器加入70个新指令,加入网际网络串流SIMD延伸集称为MMX,能大幅提升先进影像、3D、串流音乐、影片、语音辨识等应用的性能,它能大幅提升网际网络的使用经验,让使用者能浏览逼真的线上博物馆与商店,以及下载高品质影片,Intel首次导入0.25微米技术,Intel Pentium III 晶体管数目约为950万颗。
与此同年,英特尔还发布了PentiumIII Xeon处理器。作为PentiumII Xeon的后继者,除了在内核架构上采纳全新设计以外,也继承了Pentium III处理器新增的70条指令集,以更好执行多媒体、流媒体应用软件。除了面对企业级的市场以外,Pentium III Xeon加强了电子商务应用与高阶商务计算的能力。在缓存速度与系统总线结构上,也有很多进步,很大程度提升了性能,并为更好的多处理器协同工作进行了设计。
2000年推出的Pentium 4处理器内建了4200万个晶体管,以及采用0.18微米的 电路,Pentium 4初期推出版本的速度就高达1.5GHz,晶体管数目约为4200万颗,翌年8月,Pentium 4 处理理达到2 GHz的里程碑。2002年英特尔推出新款Intel Pentium 4处理器内含创新的Hyper-Threading(HT) 超线程技术。超线程技术打造出新等级的高性能桌上型电脑,能同时快速执行多项运算应用,或针对支持多重线程的软件带来更高的性能。超线程技术让电脑性能增加25%。除了为桌上型电脑使用者提供超线程技术外,英特尔也达成另一项电脑里程碑,就是推出运作频率达3.06 GHz的Pentium 4处理器,是首款每秒执行30亿个运算周期的商业 微处理器,如此优异的性能要归功于当时业界最先进的0.13微米制程技术, 翌年,内建超线程技术的Intel Pentium 4处理器频率达到3.2 GHz。
PentiumM:由 以色列小组专门设计的新型移动CPU,Pentium M是 英特尔公司的x86架构 微处理器,供笔记簿型个人电脑使用,亦被作为Centrino的一部分,于2003年3月推出。公布有以下 主频:标准1.6GHz,1.5GHz,1.4GHz,1.3GHz,低电压1.1GHz,超低电压900MHz。为了在低 主频得到高效能,Banias作出了优化,使每个时钟所能执行的指令数目更多,并通过高级 分支预测来降低错误预测率。另外最突出的改进就L2高速 缓存增至1MB(P3-M和P4-M都只有512KB),估计Banias数目高达7700万的晶体管大部分就用在这上。
此外还有一系列与减少功耗有关的设计:增强型Speedstep技术是必不可少的了,拥有多个供电电压和计算频率,从而使性能可以更好地满足应用需求。
智能供电分布可将系统电量集中分布到 处理器需要的地方,并关闭空闲的应用;移动电压定位(MVPIV)技术可根据处理器活动动态降低电压,从而支持更低的散热设计功率和更小巧的外形设计;经优化功率的400MHz系统总线;Micro-opsfusion微操作指令融合技术,在存在多个可同时执行的指令的情况下,将这些指令合成为一个指令,以提高性能与电力使用效率。专用的堆栈管理器,使用记录内部运行情况的专用硬件, 处理器可无中断执行程序。
Banias所对应的 芯片组为855系列,855芯片组由北桥芯片855和 南桥芯片ICH4-M组成,北桥芯片分为不带内置 显卡的855PM(代号Odem)和带内置显卡的855GM(代号Montara-GM),支持高达2GB的DDR266/200内存,AGP4X,USB2.0,两组ATA-100、AC97音效及Modem。其中855GM为三维及显示引擎优化InternalClockGating,它可以在需要时才进行三维显示引擎供电,从而降低 芯片组的功率。
2005年Intel推出的双核心处理器有Pentium D和Pentium Extreme Edition,同时推出945/955/965/975芯片组来支持新推出的双核心处理器,采用90nm工艺生产的这两款新推出的双核心处理器使用是没有针脚的LGA 775接口,但处理器底部的贴片电容数目有所增加,排列方式也有所不同。
桌面平台的核心代号Smithfield的处理器,正式命名为Pentium D处理器,除了摆脱阿拉伯数字改用英文字母来表示这次双核心处理器的世代交替外,D的字母也更容易让人联想起Dual-Core双核心的涵义。
Intel的双核心构架更像是一个双CPU平台,Pentium D处理器继续沿用Prescott架构及90nm生产技术生产。Pentium D内核实际上由于两个独立的2独立的Prescott核心组成,每个核心拥有独立的1MB L2缓存及执行单元,两个核心加起来一共拥有2MB,但由于处理器中的两个核心都拥有独立的缓存,因此必须保正每个二级缓存当中的信息完全一致,否则就会出现运算错误。
为了解决这一问题,Intel将两个核心之间的协调工作交给了外部的MCH(北桥)芯片,虽然缓存之间的数据传输与存储并不巨大,但由于需要通过外部的MCH芯片进行协调处理,毫无疑问的会对整个的处理速度带来一定的延迟,从而影响到处理器整体性能的发挥。
由于采用Prescott内核,因此Pentium D也支持EM64T技术、XD bit安全技术。值得一提的是,Pentium D处理器将不支持Hyper-Threading技术。原因很明显:在多个物理处理器及多个逻辑处理器之间正确分配数据流、平衡运算任务并非易事。比如,如果应用程序需要两个运算线程,很明显每个线程对应一个物理内核,但如果有3个运算线程呢?因此为了减少双核心Pentium D架构复杂性,英特尔决定在针对主流市场的Pentium D中取消对Hyper-Threading技术的支持。
同出自Intel之手,而且Pentium D和Pentium Extreme Edition两款双核心处理器名字上的差别也预示着这两款处理器在规格上也不尽相同。其中它们之间最大的不同就是对于超线程(Hyper-Threading)技术的支持。Pentium D不支持超线程技术,而Pentium Extreme Edition则没有这方面的限制。在打开超线程技术的情况下,双核心Pentium Extreme Edition处理器能够模拟出另外两个逻辑处理器,可以被系统认成四核心系统。
Pentium EE系列都采用三位数字的方式来 标注,形式是Pentium EE8xx或9xx,例如Pentium EE840等等,数字越大就表示规格越高或支持的特性越多。
Pentium EE8x0:表示这是Smithfield核心、每核心1MB 二级缓存、800MHzFSB的产品,其与PentiumD8x0系列的唯一区别仅仅只是增加了对 超线程技术的支持,除此之外其它的技术特性和参数都完全相同。
Pentium EE9x5:表示这是Presler核心、每核心2MB 二级缓存、1066MHzFSB的产品,其与PentiumD9x0系列的区别只是增加了对 超线程技术的支持以及将 前端总线提高到1066MHzFSB,除此之外其它的技术特性和参数都完全相同。
单核心的Pentium 4、Pentium 4 EE、Celeron D以及双核心的Pentium D和Pentium EE等CPU采用LGA775封装。与以前的Socket 478接口CPU不同,LGA 775接口CPU的底部没有传统的针脚,而代之以775个触点,即并非针脚式而是触点式,通过与对应的LGA 775插槽内的775根触针接触来传输信号。LGA 775接口不仅能够有效提升处理器的信号强度、提升处理器频率,同时也可以提高处理器生产的良品率、降低生产成本。
第六代
第6阶段(2005年至今)是酷睿(core)系列微处理器时代,通常称为第6代。“酷睿”是一款领先节能的新型微架构,设计的出发点是提供卓然出众的性能和能效,提高每瓦特性能,也就是所谓的能效比。早期的酷睿是基于笔记本处理器的。 酷睿2:英文名称为Core 2 Duo,是英特尔在2006年推出的新一代基于Core微架构的产品体系统称。于2006年7月27日发布。酷睿2是一个跨平台的构架体系,包括服务器版、桌面版、移动版三大领域。其中,服务器版的开发代号为Woodcrest,桌面版的开发代号为Conroe,移动版的开发代号为Merom。
酷睿2处理器的Core微架构是Intel的以色列设计团队在Yonah微架构基础之上改进而来的新一代英特尔架构。最显著的变化在于在各个关键部分进行强化。为了提高两个核心的内部数据交换效率采取共享式二级缓存设计,2个核心共享高达4MB的二级缓存。
继LGA775接口之后,Intel首先推出了LGA1366平台,定位高端旗舰系列。首颗采用LGA 1366接口的处理器代号为Bloomfield,采用经改良的Nehalem核心,基于45纳米制程及原生四核心设计,内建8-12MB三级缓存。LGA1366平台再次引入了Intel超线程技术,同时QPI总线技术取代了由Pentium 4时代沿用至今的前端总线设计。最重要的是LGA1366平台是支持三通道内存设计的平台,在实际的效能方面有了更大的提升,这也是LGA1366旗舰平台与其他平台定位上的一个主要区别。
作为高端旗舰的代表,早期LGA1366接口的处理器主要包括45nm Bloomfield核心酷睿i7四核处理器。随着Intel在2010年买入32nm工艺制程,高端旗舰的代表被酷睿i7-980X处理器取代,全新的32nm工艺解决六核心技术,拥有最强大的性能表现。对于准备组建高端平台的用户而言,LGA1366依然占据着高端市场,酷睿i7-980X以及酷睿i7-950依旧是不错的选择。
Intel Core i7是一款45nm 原生四核处理器,处理器拥有8MB 三级缓存,支持 三通道DDR3内存。处理器采用LGA 1366 针脚设计,支持第二代 超线程技术,也就是处理器能以八线程运行。根据网上流传的测试,同频Core i7比Core 2 Quad性能要高出很多。
综合之前的资料来看,英特尔首先会发布三款Intel Core i7处理器,频率分别为3.2GHz、2.93GHz和2.66GHz, 主频为3.2GHz的属于Intel Core i7 Extreme,处理器售价为999美元,当然这款顶级处理器面向的是发烧级用户。而频率较低的2.66GHz的定价为284美元,约合1940元人民币,面向的是普通消费者。全新一代Core i7处理器将于2013年第四季度推出。
而从英特尔技术峰会2008(IDF2008)上英特尔展示的情况来看,core i7的能力在core2 extreme qx9770(3.2GHz)的三倍左右。IDF上,intel工作人员使用一颗core i7 3.2GHz处理器演示了CineBench R10 多线程渲染,结果很惊人。渲染开始后,四颗核心的八个 线程同时开始工作,仅仅19秒钟后完整的画面就呈现在了屏幕上,得分超过45800。相比之下,core2 extreme qx 9770 3.2GHz只能得到一万两千分左右, 超频到4.0GHz才勉强超过15000分,不到core i7的3分之一。core i7的超强实力由此可窥见一斑。
Core i5是一款基于Nehalem架构的四核处理器,采用整合内存控制器,三级缓存模式,L3达到8MB,支持Turbo Boost等技术的新处理器电脑配置。它和Core i7(Bloomfield)的主要区别在于总线不采用QPI,采用的是成熟的DMI(Direct Media Interface),并且只支持双通道的DDR3内存。结构上它用的是LGA1156 接口,Core i7用的是LGA1366。i5有睿频技术,可以在一定情况下超频。
Core i3可看作是Core i5的进一步精简版(或阉割版),将有32nm工艺版本(研发代号为Clarkdale,基于Westmere架构)这种版本。Core i3最大的特点是整合GPU(图形处理器),也就是说Core i3将由CPU+GPU两个核心封装而成。由于整合的GPU性能有限,用户想获得更好的3D性能,可以外加显卡。值得注意的是,即使是Clarkdale,显示核心部分的制作工艺仍会是45nm。i3 i5 区别最大之处是 i3没有睿频技术。
2010年6月,Intel再次发布革命性的处理器——第二代Core i3/i5/i7。第二代Core i3/i5/i7隶属于第二代智能酷睿家族,全部基于全新的Sandy Bridge微架构,相比第一代产品主要带来五点重要革新:1、采用全新32nm的Sandy Bridge微架构,更低功耗、更强性能。2、内置高性能GPU(核芯显卡),视频编码、图形性能更强。 3、睿频加速技术2.0,更智能、更高效能。4、引入全新环形架构,带来更高带宽与更低延迟。5、全新的AVX、AES指令集,加强浮点运算与加密解密运算。
SNB( Sandy Bridge)是英特尔在2011年初发布的新一代 处理器微架构,这一构架的最大意义莫过于重新定义了“ 整合平台”的概念,与处理器“无缝融合”的“ 核芯显卡”终结了“ 集成显卡”的时代。这一创举得益于全新的32nm制造工艺。由于Sandy Bridge 构架下的处理器采用了比之前的45nm工艺更加先进的32nm制造工艺,理论上实现了CPU功耗的进一步降低,及其 电路尺寸和性能的显著优化,这就为将整合图形核心(核芯显卡)与CPU封装在同一块基板上创造了有利条件。此外,第二代酷睿还加入了全新的 高清视频处理单元。视频转解码速度的高与低跟处理器是有直接关系的,由于高清视频处理单元的加入,新一代 酷睿处理器的视频处理时间比老款处理器至少提升了30%。新一代Sandy Bridge处理器采用全新LGA1155接口设计,并且无法无LGA1156接口兼容。Sandy Bridge是将取代Nehalem的一种新的微架构,不过仍将采用32nm工艺制程。比较吸引人的一点是这次Intel不再是将CPU核心与GPU核心用“胶水”粘在一起,而是将两者真正做到了一个核心里。
在2012年4月24日下午北京天文馆,intel正式发布了 ivy bridge(IVB)处理器。22nm Ivy Bridge会将执行单元的数量翻一番,达到最多24个,自然会带来性能上的进一步跃进。Ivy Bridge会加入对DX11的支持的 集成显卡。另外新加入的XHCI USB 3.0控制器则共享其中四条通道,从而提供最多四个USB 3.0,从而支持原生USB3.0。cpu的制作采用3D晶体管技术的CPU耗电量会减少一半。
3组成
微处理器由 算术逻辑单元(ALU,Arithmetic Logical Unit); 累加器和 通用寄存器组; 程序计数器(也叫 指令指标器);时序和控制逻辑部件;数据与 地址锁存器/缓冲器; 内部总线组成。其中 运算器和控制器是其主要组成部分。 [2]
算术逻辑单元
算术逻辑单元ALU主要完成算术运算(+,-、×、÷、比较)和各种逻
辑运算(与、或、非、异或、移位)等操作。ALU是组合 电路,本身无寄存 操作数的功能,因而必须有保存操作数的两个 寄存器: 暂存器TMP和 累加器AC,累加器既向ALU提供操作数,又接收ALU的运算结果。
寄存器阵列实际上相当于微处理器内部的RAM,它包括 通用寄存器组和专用寄存器组两部分,通用寄存器(A,B,C,D)用来存放参加运算的数据、中间结果或地址。它们一般均可作为两个8位的 寄存器来使用。处理器内部有了这些 寄存器之后,就可避免频繁地访问 存储器,可缩短 指令长度和 指令执行时间,提高机器的运行速度,也给编程带来方便。专用 寄存器包括 程序计数器PC、堆栈指示器SP和 标志寄存器FR,它们的作用是固定的,用来存放地址或地址基值。其中:
A) 程序计数器PC用来存放下一条要执行的 指令地址,因而它控制着程序的执行顺序。在 顺序执行指令的条件下,每取出指令的一个字节,PC的内容自动加1。当程序发生转移时,就必须把新的 指令地址(目标地址)装入PC,这通常由转移指令来实现。
B)堆栈指示器SP用来存放栈顶地址。 堆栈是 存储器中的一个特定区域
。它按“后进先出”方式工作,当新的数据压入 堆栈时,栈中原存信息不变,只改变栈顶位置,当数据从栈弹出时,弹出的是栈顶位置的数据,弹出后自动调正栈顶位置。也就是说,数据在进行压栈、 出栈操作时,总是在栈顶进行。 堆栈一旦初始化(即确定了栈底在内存中的位置)后,SP的内容(即栈顶位置)使由CPU自动管理。
C) 标志寄存器也称 程序状态字(PSW) 寄存器,用来存放 算术、逻辑运算 指令执行后的结果特征,如结果为0时,产生进位或溢出标志等。
定时与控制逻辑是微处理器的核心控制部件,负责对整个计算机进行控制、包括从 存储器中取 指令,分析指令(即指令译码)确定指令操作和 操作数地址,取操作数,执行指令规定的操作,送运算结果到存储器或I/O端口等。它还向微机的其它各部件发出相应的 控制信号,使CPU内、外各部件间协调工作。
内部总线用来连接微处理器的各功能部件并传送微处理器内部的数据和 控制信号。
必须指出,微处理器本身并不能单独构成一个独立的工作系统,也不能独立地执行程序,必须配上存 储器、输入输出设备构成一个完整的 微型计算机后才能独立工作。 [2]
存储器
微型计算机的 存储器用来存放当前正在使用的或经常使用的程序和数据。 存储器按读、写方式分为随机存储器RAM(Random Access Memory)和 只读存储器ROM(Read only Memory)。RAM也称为读/写 存储器,工作过程中CPU可根据需要随时对其内容进行读或写操作。RAM是 易失性存储器,即其内容在断电后会全部丢失,因而只能存放暂时性的程序和数据。ROM的内容只能读出不能写入,断电后其所存信息仍保留不变,是非易失性存储器。所以ROM常用来存放永久件的程序和 数据。如初始导引程序、 监控程序、操作系统中的基本输入、输出管理程序BIOS等。 [2]
I/O接口
输入/输出接口 电路是 微型计算机的重要组成部件。他是 微型计算机连接外部输入、 输出设备及各种控制对象并与外界进行信息交换的逻辑控制 电路。由于外设的结构、工作速度、信号形式和数据格式等各不相同,因此它们不能直接挂接到 系统总线上,必须用输入/输出接口 电路来做中间转换,才能实现与CPU间的信息交换。I/O接口也称I/O适配器,不同的外设必须配备不同的I/O适配器。I/O接口 电路是微机应用系统必不可少的重要组成部分。任何一个微机应用系统的研制和设计,实际上主要是I/O接口的研制和设计。因此I/O 接口技术是本课程讨论的重要内容之一,我们将在第八章中详细介绍。 [2]
总线
总线是 计算机系统中各部件之间传送信息的公共通道,是 微型计算机的重要组成部件。它由若干条通信线和起驱动,隔离作用的各种三态门器件组成。 微型计算机在结构形式上总是采用 总线结构,即构成微机的各功能部件(微处理器、 存储器、I/O接口 电路等)之间通过总线相连接,这是微型计算机系统结构上的独特之处。采用 总线结构之后,使系统中各功能部件间的相互关系转变为各部件面向总线的单一关系,一个部件(功能板/卡)只要符合 总线标准,就可以连接到采用这种总线标准的系统中,从而使系统功能扩充或更新容易、结构简单、可靠性大大提高。在 微型计算机中,根据他们所处位置和应用场合, 总线可被分为以下四级,如图1.4所示。
(1)片 内总线:它位于微处理器芯片内部,故称为芯片 内部总线。用于微处理器内部ALU和各种寄存器等部件间的互连及信息传送(如图1.3中的 内部总线就是片 内总线)。由于受芯片面积及对外引脚数的限制,片 内总线大多采用单 总线结构,这有利于芯片集成度和成品率的提高,如果要求加快内部数据 传送速度,也可采用双总线或三总线结构。
(2)片总线:片总线又称元件级(芯片级)总线或 局部总线。微机主板、单扳机以及其它一些插件板、卡(如各种I/O接口板/卡),它们本身就是一个完整的子系统,板/卡上包含有CPU,RAM,ROM,I/O接口等各种芯片,这些芯片间也是通过 总线来连接的,因为这有利于简化结构,减少连线,提高可靠性,方便信息的传送与控制。通常把各种板、卡上实现芯片间相互连接的总线称为片总线或元件级总线。
相对于一台完整的 微型计算机来说,各种板/卡只是一个子系统,是一个局部,故又把片总线称为 局部总线,而把用于连接微机各功能部件插卡的总线称为 系统总线。 局部总线是一个重要的概念,我们将在第七章中讨论。
(3) 内总线:内总线又称 系统总线或板级总线。因为该总线是用来连接微机各功能部件而构成一个完整 微机系统的,如图1.2中所示,所以称之为 系统总线。 系统总线是 微机系统中最重要的总线,人们平常所说的微机总线就是指系统总线,如PC总线、AT总线(ISA总线)、PCI总线等。 系统总线是我们要讨论的重点内容之一。
系统总线上传送的信息包括数据信息、地址信息、控制信息,因此,系统总线包含有三种不同功能的总线,即 数据总线DB(Data Bus)、 地址总线AB(Address Bus)和 控制总线CB(Control Bus),如图1.2中所示。
数据总线DB用于传送数据信息。 数据总线是双向三态形式的总线,即他既可以把CPU的 数据传送到 存储器或I/O接口等其它部件,也可以将其它部件的数据传送到CPU。 数据总线的位数是 微型计算机的一个重要指标,通常与微处理的字长相一致。例如Intel 8086微处理器 字长16位,其 数据总线宽度也是16位。需要指出的是,数据的含义是广义的,它可以是真正的数据,也可以 指令代码或状态信息,有时甚至是一个控制信息,因此,在实际工作中, 数据总线上传送的并不一定仅仅是真正意义上的数据。
地址总线AB是专门用来传送地址的,由于地址只能从CPU传向外部 存储器或I/O端口,所以地址总线总是单向三态的,这与 数据总线不同。 地址总线的位数决定了CPU可 直接寻址的内存空间大小,比如8位微机的地址总线为16位,则其最大可 寻址空间为2^16=64KB,16位微型机的地址总线为20位,其可寻址空间为2^20=1MB。一般来说,若 地址总线为n位,则可 寻址空间为2^n字节。
控制总线CB用来传送 控制信号和 时序信号。 控制信号中,有的是微处理器送往 存储器和I/O接口 电路的,如读/写信号, 片选信号、 中断响应信号等;也有是其它部件反馈给CPU的,比如:中断申请信号、 复位信号、总线请求信号、限备就绪信号等。因此, 控制总线的传送方向由具体 控制信号而定,一般是双向的,控制总线的位数要根据系统的实际控制需要而定。实际上 控制总线的具体情况主要取决于CPU。
(4)外总线:也称通信总线。用于两个系统之间的连接与通信,如两台 微机系统之间、微机系统与其他电子仪器或 电子设备之间的通信。常用的通信总线有 IEEE-488总线,VXI总线和RS-232串行总线等。外总线不是 微机系统本身固有的,只有微型机应用系统中才有。
CPU是Central Processing Unit( 中央微处理器)的缩写,它是计算机中最重要的一个部分,由 运算器和控制器组成。如果把计算机比作人,那么CPU就是人的大脑。CPU的发展非常迅速,个人电脑从8088(XT)发展到Pentium 4时代,只经过了不到二十年的时间。
4AMD CPU
K5
K5是AMD公司第一个独立生产的x86级 CPU,发布时间在1996年。由于K5在开发上遇到了问题,其上市时间比 英特尔的Pentium晚了许多,再加上性能不好,这个不成功的产品一度使得AMD的市场份额大量丧失。K5的性能非常一般,整数运算能力不如 Cyrix的6x86,但是仍比Pentium略强, 浮点运算能力远远比不上Pentium,但稍强于Cyrix。综合来看,K5属于实力比较平均的那一种产品。K5低廉的价格显然比其性能更能吸引消费者,低价是这款CPU最大的卖点。 AMD 自然不甘心Pentium在CPU市场上呼风唤雨,因此它们在1997年又推出了K6。K6这款CPU的设计指标是相当高的,它拥有全新的MMX 指令以及64KB L1 Cache(比 奔腾MMX多了一倍),整体性能要优于奔腾MMX,接近同 主频PⅡ的水平。K6与K5相比,可以平行地处理更多的 指令,并运行在更高的 时钟频率上。AMD在整数运算方面做得非常成功,K6稍微落后的地方是在运行需要使用到MMX或 浮点运算的应用程序方面,比起同样频率的Pentium 要差许多。
K6
K6拥有32KB数据L1 Cache,32KB 指令L1 Cache,集成了880万个晶体管,采用0.35微米技术,五层CMOS,C4工艺反装晶片, 内核面积168平方毫米(新产品为68平方毫米),使用Socket7架构。 Cyrix 也算是一家老资格的CPU开发商了,早在x86时代,它和英特尔,AMD就形成了三雄并立的局面。
K6-2
AMD于1998年4月正式推出了K6-2微处理器。它采用0.25微米工艺制造,芯片面积减小到了68平方毫米,晶体管数目也增加到930万个。另外,K6-2具有64KB L1 Cache,二级缓存集成在 主板上,容量从512KB到2MB之间,速度与 系统总线频率同步,工作电压为2.2V,支持Socket 7架构。
K6-2是一个K6芯片加上100MHz 总线频率和支持3D Now!浮点 指令的“结合物”。3D Now!技术是对x86体系的重大突破,它大大加强了处理3D图形和多媒体所需要的密集 浮点运算性能。此外,K6-2支持 超标量MMX技术,支持100MHz 总线频率,这意味着系统与L2缓存和内存的传输率提高近50%,从而大大提高了整个系统的表现。 作为Cyrix公司独自研发的最后一款微处理器,Cyrix MⅡ是于1998年3月开始生产的。除了具有6x86本身的特性外,该微处理器还支持MMX 指令,其核心电压为2.9V,具有256 字节指令;3.5X 倍频;核心内集成650万个晶体管,功耗20.6瓦;64KB 一级缓存。
K6-Ⅲ
AMD于1999年2月推出了代号为“Sharptooth”(利齿)的K6-Ⅲ,它是该公司最后一款支持Super 7架构和CPGA封装形式的CPU,采用0.25微米 制造工艺、内核面积是135平方毫米,集成了2130万个晶体管,工作电压为2.2V/2.4V。
Athlon(K7)
相对于K6-2而言,K6-Ⅲ最大的变化就是内部集成了256KB二级缓存(新赛扬只有128KB),并以CPU的 主频速度运行。K6-Ⅲ的这一变化将能够更大限度发挥高 主频的优势。此外,该微处理器还带有64KB 一级缓存(32KB用于 指令,另32KB用于数据),而且在 主板上还集成了以 系统总线频率同步运行的 三级缓存,其容量大小从512KB到2MB之间。 1999年6月23日,AMD公司推出了具有重大战略意义的K7微处理器,并将其正式命名为Athlon。K7有两种规格的产品:第一种采用0.25微米工艺制造,使用K7核心,工作电压为1.6V(其 缓存以 主频速度的一半运行);第二种采用0.18微米工艺制造,使用K75核心;工作电压有1.7V和1.8V两种。上述两种类型的K7微处理器内部都集成了2130万个晶体管, 外频均为200MHz。
Athlon包含128KB的L1 Cache(PⅡ/PⅢ只有32KB);512KB~1MB L2 Cache的片外 缓存。同时,它还采用了全新的宏处理结构,拥有三个并行的x86 指令译码器,可以动态推测时序, 乱序执行;K7拥有一个强劲的浮点处理单元,在3DNOW!指令的帮助下会有更进一步的3D和多媒体处理能力,这个先进的FPU使K7拥有超越其他x86微处理器2倍的性能!另外,K7采用了一种类似于Slot 1的全新的Slot A架构,从 物理结构上两者可以互换,但后者的电器性能和前者完全不兼容。在 总线方面,使用的是Digital公司的Alpha 系统总线协议EV6, 外频达200MHz;Athlon是AMD第一个具有SMP(对称多微处理器技术)能力的桌面CPU,即使用者可以用Athlon构建双微处理器甚至4微处理器系统! AMD公司在2000年6月份连续推出了新款的Thunderbird(雷鸟)、Duron( 毒龙)微处理器,再次向英特尔Coppermine(铜矿)核心的微处理器发出了强有力的挑战。
Thunderbird(雷鸟)
Thunderbird是AMD面向高端的Athlon系列延续产品,采用0.18微米的制造工艺,共有Slot A和Socket A两种不同的架构,但它们在设计上大致相同:均内置128KB的 一级缓存和256KB的二级缓存,其二级缓存与CPU 主频速度同步运行;工作电压为1.70V~1.75V,相应的功耗也比老的Athlon要小;集成3700万个晶体管,核心面积达到120平方毫米。
另外,Thunderbird微处理器支持200MHz 系统总线频率,提供巨大的带宽,且支持Alpha EV6总线协议,具有多重并行x86 指令解码器。
Duron(毒龙)
Duron微处理器是AMD首款基于Athlon核心改进的低端微处理器,它原来的研发代号称为“Spitfire”。Duron 外频也是200MHz,内置128KB的 一级缓存和64KB的全速二级缓存,它的工作电压为1.5V,因而功耗要较Thunderbird小。而且它核心面积是100平方毫米,内部集成的晶体管数量为2500万个,比K7核心的Athlon多300万个。这些特点符合了AMD面对低端市场的策略,即低成本低功耗而又高性能。在浮点性能上,基于K7体系的Duron明显优于采用P6核心设计的Intel系列微处理器,它具有三个全流水 乱序执行单元,一个用于加/减运算,一个用于复合 指令还有一个是浮点 存储单元。
5其他微处理器发展
[3] 1975年,IBM公司生产了几款基于RISC 设计的处理器。其中801就是RISC之父John Cocke的杰作。最终15年后设计出Power 架构系列产品,若干年后更出出现一个影响深远的RISC结构的芯片系列ARM
这是八十年代后, RISC架构被工业界认可后发展起的一种,HP的HPPA-RISC
1975年,摩托罗拉推出 6800 ,该款处理器拥有78条指令集。摩托罗拉很多款单片装处理器和微处理器的设计思想都来源于6800 ,即使曾经很流行功能强大的6809 也是继承了6800 血统。1985年,摩托罗拉推出MC68010和已经命名为88000的32位RISC处理器系列。但1990年由于要全力研制PowerPC而被迫停产。
Z-80是由从Intel离走的Frederico Faggin设计的8位微处理器,被认为是8080的增强版,------是也是当年很牛的一款单片机,比后来风光无限的51系列更早进入中国,八十年代初学校都是以Z80为基础教学,那种需要用电视作显示器的单板电脑就是用的这种芯片。
不过最先推出的单芯片16位处理器当数TI TMS 9900。虽然出道后势头强劲,但TI为了发展DSP业务,不得不在1982年缩小9900的产量
半导体行业另一巨头,美国国家半导体公司,就是后来收购了设计X86系列处理器的Cyrix公司的,这是1983年由国家半导体(National Semiconductor)推出NS32032,也是一款 RISC处理器,但是可惜的是 RISC架构的处理器在个人电脑应用中只有POWERPC芯片的市场还算比较成功,其它的都可以说很失败,不过在另一领域:嵌入式应用中,RISC架构的处理器确是风光无限。
1981年,由斯坦福大学和部分研究者研制出 MIPS。处理器利用了深度 流水线技术。它通过简化指令的操作周期,解决了流水线的瓶颈-联锁问题,促成 RISC思想的重要转变。
1982年,由美国伯克利大学研制的RISC-I,只有32条指令,并且具有流水线操作和使用寄存器窗口,性能比同时代单芯片设计都优越
ARM是一家芯片设计公司,自己不生产芯片,而是通过授权生产来发展 ARM系列处理器 。ARM公司在1990年11月英国剑桥的一个谷仓里成立,最初只有12人,经过11年多的发展,今日的ARM公司已经拥有700多名员工,其中60%以上都从事研发工作, ARM公司是一家既不生产芯片(fabless)也不销售芯片(chipless)的公司,它通过出售芯片技术授权,建立起新型的微处理器设计、生产和销售商业模式。更重要的是,这种商业模式取得极大的成功,采用ARM技术IP核的微处理器遍及各类电子产品:汽车、消费电子、成像、工业控制、海量存储、网络、安保和无线等市场,ARM技术几乎无处不在。ARM将其技术授权给世界上许多著名的半导体、软件和OEM厂商,每个厂商得到的都是一套独一无二的ARM相关技术及服务。利用这种合伙关系,ARM很快成为许多全球性RISC标准的缔造者。目前,总共有30家半导体公司与ARM签订了硬件技术使用许可协议,其中包括Intel、IBM、LG半导体、NEC、SONY、菲利浦和国民半导体这样的大公司。至于软件系统的合伙人,则包括微软、升阳和MRI等一系列知名公司。
6中国研发
2004年2月18日,由清华大学自主研发的32位微处理器THUMP芯片终于领到了由国家教育部颁发的“身份证”:典型 工作频率400MHz,功耗1.17mW/MHz,芯片颗粒40片,最高工作频率可达500MHz,是目前国内工作频率最高的微处理器。 “这标志着我国在自主研发CPU芯片领域迈开了实质性的一大步。”教育部对THUMP的诞生给予了较高评价。
在 龙芯1号、龙芯2号的基础上,中国正在自主研发新一代的龙芯3号。
龙芯3A的 工作频率为900MHz~1GHz,功耗约15W,频率为1GHz时双精度浮点运算速度峰值达到每秒160亿次,单精度浮点运算速度峰值每秒320亿次。龙芯3A采用意法半导体公司(STMicro)65纳米CMOS工艺生产,晶体管数目达4.25亿个,芯片采用BGA封装,引脚的数目为1121个,功耗小于15瓦。 龙芯3A集成了四个64位 超标量处理器核、4MB的二级Cache、两个DDR2/3 内存控制器、两个高性能HyperTransport控制器、一个PCI/PCIX控制器以及LPC、SPI、UART、GPIO等低速I/O控制器。龙芯3A的 指令系统与MIPS64兼容并通过指令扩展支持X86 二进制翻译。 龙芯3号在包括服务器、高性能计算机、低能耗 数据中心、个人高性能计算机、高端 桌面应用、高吞吐计算应用、工业控制、 数字信号处理、高端嵌入式应用等产品中具有广阔的市场应用前景。