ARM架构与X86架构

维基是个好东西,只不过有时候也不太准....

ARM架构,过去称作进阶精简指令集机器(Advanced RISC Machine,更早称作:Acorn RISC Machine),是一个32位精简指令集(RISC)处理器架构,其广泛地使用在许多嵌入式系统设计。由于节能的特点,ARM处理器非常适用于行动通讯领域,符合其主要设计目标为低耗电的特性。
在今日,ARM家族占了所有32位嵌入式处理器75%的比例[1],使它成为占全世界最多数的32位架构之一。ARM处理器可以在很多消费性电子产品上看到,从可携式装置(PDA、移动电话、多媒体播放器、掌上型电子游戏,和计算机)到电脑外设(硬盘、桌上型路由器)甚至在导弹的弹载计算机等军用设施中都有他的存在。在此还有一些基于ARM设计的派生产品,重要产品还包括Marvell的XScale架构和德州仪器的OMAP系列。
ARM的设计是Acorn电脑公司(Acorn Computers Ltd)于1983年开始的开发计划。
这个团队由Roger Wilson和Steve Furber带领,着手开发一种新架构,类似进阶的MOS Technology 6502处理器。Acorn有一大堆建构在6502架构上的电脑,因此能设计出一颗类似的芯片即意味着对公司有很大的优势。
团队在1985年时开发出ARM1 Sample版,而首颗"真正"的产能型ARM2于次年量产。ARM2具有32位的数据总线、26位的寻址空间,并提供64 Mbyte的寻址范围与16个32-bit的暂存器。这些暂存器其中有一颗做为(word大小)程式计数器,其前面6 bits和后面2 bits用来保存处理器状态标记(Processor Status Flags)。ARM2可能是全世界最简单实用的32位微处理器,其仅容纳了30,000个晶体管(相较于Motorola六年后的68000其包含了70,000颗)。之所以精简的原因在于它不含微码(请参阅microcode)(这表示大概只有68000的1/3至1/4),而与现今大多数的 CPU 不同,它没有包含任何的高速缓存。这个精简的特色使它只需消耗很少的电能,却能发挥比 Intel 80286 更好的效能[来源请求]。后继的处理器ARM3更备有4KB的高速缓存,使它能发挥更佳的效能。
在1980年代晚期,苹果电脑开始与Acorn合作开发新版的ARM核心,由于这专案非常重要,Acorn甚至于1990年将设计团队另组成一间名为安谋国际科技(Advanced RISC Machines Ltd.)的新公司。也基于这原因,使得ARM有时候反而称作Advanced RISC Machine而不是Acorn RISC Machine。由于其母公司ARM Holdings plc于1998年的伦敦交易市场和NASDAQ挂牌上市[1],使得Advanced RISC Machines成了ARM Ltd旗下拥有的产品。
这个专案到后来进入了ARM6,首版的式样在1991年释出,然后苹果电脑使用ARM6架构的ARM 610来当作他们Apple Newton PDA的基础。在1994年,Acorn使用ARM 610做为他们Risc PC电脑内的CPU。
在这些变革之后,内核部份却大多维持一样的大小。ARM2有30,000颗晶体管,但ARM6却也只增长到35,000颗。主要概念是以ODM的方式,使ARM核心能搭配一些选配的零件而制成一颗完整的CPU,而且可在现有的晶圆厂里制作并以低成本的方式达到很大的效能。
ARM的经营模式在于出售其知识产权核(IP core),授权厂家依照设计制作出建构于此核的微控制器和中央处理器。最成功的实作案例属 ARM7TDMI,几乎卖出了数亿套内建微控制器的装置。
DEC 购买这个架构的产权(此处会造成混淆在于其本身也制造 DEC Alpha 并研发出StrongARM。在 233 MHz 的频率下,这颗 CPU 只消耗一瓦特的电能(后来的芯片消耗得更少)。这项设计后来为了和 Intel 的控诉和解而技术移转,Intel 因而趁机以 StrongARM 架构补强他们老旧的 i960 产线。Intel 后来开发出他们自有的高效能实作,称作XScale,之后也卖给了 Marvell。

支援智能型手机、PDA和其他手持装置最常见的架构是ARMv4。XScale 和 ARM926 处理器是ARMv5TE,而且比起建构在 ARMv4 的 StrongARM、ARM925T 和 ARM7TDMI 等处理器还更常见于许多高阶装置上。


ARM 授权方式


ARM 公司本身并不靠自有的设计来制造或出售 CPU ,而是将处理器架构授权给有兴趣的厂家。ARM 提供了多样的授权条款,包括售价与散播性等项目。对于授权方来说,ARM 提供了 ARM 内核的整合硬件叙述,包含完整的软件开发工具(编译器、debugger、SDK),以及针对内含 ARM CPU 硅芯片的销售权。对于无晶圆厂的授权方来说,其希望能将 ARM 内核整合到他们自行研发的芯片设计中,通常就仅针对取得一份生产就绪的智财核心技术(IP Core)认证。对这些客户来说,ARM 会释出所选的 ARM 核心的闸极电路图,连同抽象模拟模型和测试程式,以协助设计整合和验证。需求更多的客户,包括整合元件制造商(IDM)和晶圆厂家,就选择可合成的RTL(暂存器转移层级,如 Verilog)形式来取得处理器的智财权(IP)。借着可整合的 RTL,客户就有能力能进行架构上的最佳化与加强。这个方式能让设计者完成额外的设计目标(如高震荡频率、低能量耗损、指令集延伸等)而不会受限于无法更动的电路图。虽然 ARM 并不授予授权方再次出售 ARM 架构本身,但授权方可以任意地出售制品(如芯片元件、评估板、完整系统等)。商用晶圆厂是特殊例子,因为他们不仅授予能出售包含 ARM 内核的硅晶成品,对其它客户来讲,他们通常也保留重制 ARM 内核的权利。

就像大多数 IP 出售方,ARM 依照使用价值来决定 IP 的售价。在架构上而言,更低效能的 ARM 内核比更高效能的内核拥有较低的授权费。以硅芯片实作而言,一颗可整合的内核要比一颗硬件宏(黑箱)内核要来得贵。更复杂的价位问题来讲,持有 ARM 授权的商用晶圆厂(例如韩国三星和日本富士通)可以提供更低的授权价格给他们的晶圆厂客户。透过晶圆厂自有的设计技术,客户可以更低或是免费的ARM预付授权费来取得 ARM 内核。相较于不具备自有设计技术的专门半导体晶圆厂(如台积电和联电),富士通/三星对每片晶圆多收取了两至三倍的费用。对中少量的应用而言,具备设计部门的晶圆厂提供较低的整体价格(透过授权费用的补助)。对于量产而言,由于长期的成本缩减可借由更低的晶圆价格,减少ARM的NRE成本,使得专门的晶圆厂也成了一个更好的选择。


许多半导体公司持有 ARM 授权:Atmel、Broadcom、Cirrus Logic、Freescale(于2004从摩托罗拉公司独立出来)、富士通、英特尔(借由和Digital的控诉调停)、IBM,英飞凌科技,任天堂,恩智浦半导体(于2006年从独立出来)、OKI电气工业,三星电子,Sharp,STMicroelectronics,德州仪器 和 VLSI等许多这些公司均拥有各个不同形式的ARM授权。虽然ARM的授权项目由保密合约所涵盖,在智慧财产权工业,ARM是广为人知最昂贵的CPU内核之一。单一的客户产品包含一个基本的 ARM 内核可能就需索取一次高达美金20万的授权费用。而若是牵涉到大量架构上修改,则费用就可能超过千万美元。 目前使用率最广的几种ARM内核处理器:

高通:Snapdragon
苹果iPhone 3GS:三星S5PC100(ARM Cortex A8内核) 苹果iPhone 4:苹果A4
苹果iPad:苹果A4




高通 Snapdragon处理器型号汇总:

型号:

频率:

架构:

CPU:

GPU:

制造工艺

代级:

发布时间:

QSD8250

1 GHz

ARMv7

[color=rgb(6, 69, 173)]Cortex-A8(Scorpion)

Adreno 200

65 nm

1st Gen

Q4 2008

QSD8650

1 GHz

ARMv7

[color=rgb(6, 69, 173)]Cortex-A8(Scorpion)

Adreno 200

65 nm

1st Gen

Q4 2008

QSD8250A

1.3 GHz

ARMv7

[color=rgb(6, 69, 173)]Cortex-A8(Scorpion)

Adreno 205

45 nm

2nd Gen

Q4 2009

QSD8650A

1.3 GHz

ARMv7

[color=rgb(6, 69, 173)]Cortex-A8(Scorpion)

Adreno 205

45 nm

2nd Gen

Q4 2009

MSM7230

800 MHz

ARMv7

[color=rgb(6, 69, 173)]Cortex-A8(Scorpion)

Adreno 205

45 nm

2nd Gen

Q2 2010

MSM7630

800 MHz

ARMv7

[color=rgb(6, 69, 173)]Cortex-A8(Scorpion)

Adreno 205

45 nm

2nd Gen

Q2 2010

MSM8255

1 GHz

ARMv7

[color=rgb(6, 69, 173)]Cortex-A8(Scorpion)

Adreno 205

45 nm

2nd Gen

Q2 2010

MSM8655

1 GHz

ARMv7

[color=rgb(6, 69, 173)]Cortex-A8(Scorpion)

Adreno 205

45 nm

2nd Gen

Q2 2010

MSM8260

Dual 1.2 GHz

ARMv7

[color=rgb(6, 69, 173)]Cortex-A9 MPCore

Adreno 220

45 nm

3rd Gen

Q3 2010

MSM8660

Dual 1.2 GHz

ARMv7

[color=rgb(6, 69, 173)]Cortex-A9 MPCore

Adreno 220

45 nm

3rd Gen

Q3 2010

QSD8672

Dual 1.5 GHz

ARMv7

[color=rgb(6, 69, 173)]Cortex-A9 MPCore

Adreno 220

45 nm

3rd Gen

2011?

MSM8270

Dual-core

ARMv7

[color=rgb(6, 69, 173)]Cortex-A15 MPCore

Adreno 300

28 nm

4th Gen

2011

MSM8960

Dual-core

ARMv7

[color=rgb(6, 69, 173)]Cortex-A15 MPCore

Adreno 300

28 nm

4th Gen

2011

于苹果A4处理器的几篇文章:

美国科技博客Ars Technica联合创始人乔恩·斯图克斯(Jon Stokes)今天撰文,对苹果iPad所采用的A4处理器的内核、配置以及所采用的技术进行了分析。他认为,苹果之所以对A4的细节信息保持沉默,是不想让外界将过多的注意力放在这款芯片产品上,避免A4喧宾夺主,从而突出iPad的软件优势。
沉默的苹果


       多数企业在耗费巨资设计复杂芯片时,都会大肆宣扬。Sun或IBM等公司所生产的芯片只被用于其自身的系统,尽管如此,他们还是在搭配新款处理器的产品面市前就将该处理器的细节信息公布于众。包括游戏机厂商、SoC(片上系统)厂商以及PC芯片厂商在内,几乎所有的半导体厂商都是如此。但只有苹果是个例外。
  自从上月发布iPad平板电脑后,媒体对于该产品使用的处理器所知道的所有信息只有两个字母:A4。其他的信息都被视为最高机密,这种保密策略也引发了大量的猜测,有些比较合理,有些则完全是捕风捉影。

  苹果为何对A4如此保密?苹果为何没有向ISSCC(IEEE International Solid-State Circuits Conference,译注:是美国电气和电子工程师学会(IEEE)主办的国际电子电路研讨会,有半导体领域的奥林匹克之称) 提交论文,或者发表白皮书?

  我并不知道这些问题的答案,但综合我对A4的了解,我怀疑有两种可能。首先,这只是因为苹果CEO史蒂夫·乔布斯(Steve Jobs)喜欢保密。当然,这完全是我的推测。A4毫无疑问能够让他获得这样一种特别的感觉:“我有自己特制的SoC,而你们却对其一无所知。”说实在的,我们难道不想知道这是一种什么感觉吗?至少我想。

  第二种可能是A4并不值得过分宣传。这或许也是最为可能的一种原因。如果苹果告诉我们A4的细节信息,多数人的注意力或许就会转向A4的缺陷,而不是iPad的优点。

  透析A4配置

  当我在发布会上看到iPad视频并看到有关该产品的使用报道时,我坚定地相信,这款产品采用的是ARM Cortex A9处理器核心,甚至有可能是双核版。但最终的结果是,A4是一款以Cortex A8为核心、主频为1GHz的SoC,并且搭配了PwerVR SGX图形处理器。A4采用单核Cortex A8核心的消息并未被公布,但多方消息人士向我透露了这一确切消息,尽管他们的理由各不相同。我曾经希望对此加以怀疑,但却无法做到。

  总之,A4与其他即将上市的采用Cortex A8核心的SoC有着很强的可比性,A4甚至有可能采用了更少的硬件。iPad本身并不需要太多的I/O处理,因此A4本身也就可以舍弃一些没有必要的I/O元件。与之相比,基于Cortex A8的常规SoC则拥有更多的I/O硬件,因为你永远不知道用户究竟需要那一种连接方式。

  例如,像飞思卡尔i.MX51这样一款基于Cortex A8的SoC就拥有1个红外模块、3个用于串行通信(RS232接口等)的UART(通用异步接收/发送装置)模块、4个USB模块以及1个键盘控制器,这还只是一小部分。当然,iPad很可能只需要1个USB接口和1个UART来进行串行连接,而且这两个接口都与30针的连接器相连(假设与iPhone(手机上网)所采用的30针连接器相同)。由于多点触控输入控制器将通过USB接口或串口与芯片相连,而且只能二选其一(我查阅了意法半导体出品的STM32TS60多点触感控制器的介绍,该产品只能支持USB接口或串口中的一个),因此可能还有另外一个用于这一目的的接口。

  苹果的30针插头能够支持电视输出。最近有传言称,iPad的SDK(软件开发套件)显示,该产品支持外接显示器,而且至少已经有一家公司发布了一款适配器。

  在SoC常见的模块中,A4很可能还缺乏另外一种与拍照和视频摄像头相关的硬件。苹果iPad有可能是唯一一款没有内置摄像头的Cortex A8设备,因此苹果有可能会去掉一些专门用于处理图片的模块。

  尽管猜测苹果没有在A4中提供什么模块非常有趣,但最终目的还在于得出一个结论:由于底部配有30针连接器,而且没有内置任何摄像头,因此A4所需要的I/O支持比同类型的智能手机和智能本芯片少得多。这就意味着A4只包含有一个GPU、一个CPU、内存接口模块(NAND和DDR),可能还包含有安全硬件、系统硬件以及几个I/O控制器。也就是说,A4非常精简,以至于无法找到这样一款现成的SoC。

  P.A.Semi的职责

  如果苹果只是购买了Cortex A8的授权,并没有自己设计一款CPU的核心,那么收购P.A.Semi的意义又在哪里?这一问题的答案尚不明确。

  苹果2008年4月刚刚收购了P.A.Semi,想要围绕ARMv7架构设计一款全新的核心,1年多的时间似乎不太够用。高通Scorpion核心就是一款与Cortex A8类似的处理器核心,但却具备更多的SIMD(单指令多数据流)引擎,并且具备更深的管道,该项目历经数年才开发完成。不难想象,苹果正在开发类似于Scorpion的产品,但短期内不会面市。

  目前尚不清楚P.A.Semi是否完全参与到A4的设计过程中,P.A.Semi的团队的最大贡献有可能在于A4的动态功率优化。

  P.A.Semi公司2005年末推出的PWRficient芯片通过大范围使用功率和时钟门控(power and clock gating)技术实现了超高的能耗效率。功率门控是一种较为易懂的技术,它能够关闭部分未使用的芯片。但说起来容易做起来难,因为需要将芯片分割成为许多模块,然后独立对其进行睡眠和唤醒操作。除此之外,还要对这些模块的大小和排序进行仔细设计,以免在进入和退出睡眠状态时产生额外的延迟,从而对芯片的整体响应时间产生影响。这些延迟和响应时间问题会使得功率门控很难被部署在高速处理器上,这也是为什么PWRficient处理器所使用的功率门控数量对于高性能处理器而言意义非凡的原因。

  时钟门控则是PWRficient芯片广泛使用的另外一项技术,它同样有着自己的挑战。在一款现代化的SoC上,时钟分配网络最多会耗费半数动态动率。时钟门控则可以在某些不需要的时候将时钟与芯片相隔绝,从而达到削减时钟树的目的。



  至于A4究竟在多大程度上使用了这两种技术,还要等到苹果公布消息后才能知道,但苹果有可能永远都不会这么做。即使这些技术并没有被广泛应用于现有的A4处理器上,今后的版本或类似的产品却有可能更多地使用这些技术。

  说到类似的产品,P.A. Semi团队完全有可能并未参与到iPad芯片的设计,而是参与到了iPhone SoC的设计中。由于iPad的屏幕太大,而且与其他与原件相比,其能耗要大得多。因此对于平板电脑这样大个头的设备而言,很难想象A4能够比Snapdragon等芯片为iPad带来更多的电池续航能力,毕竟Snapdragon和i.MX515比A4多出来的那些硬件所增加的能耗对平板电脑而言微不足道。但是对iPhone进行努力优化却有可能从根本上提升这款产品的电池续航时间,使之在竞争中有上佳表现。

  iPad与Wii

  归根结底,我认为苹果之所以对A4的信息保持沉默,原因在于iPad的真正优势在于软件,也就是系统的效率、系统和应用的用户界面设计以及由软件团队创造的优异用户体验。

  从这方面来看,iPad与Mac很像。Mac采用了较为普通的硬件,但却提供了优秀的工业设计和卓越的用户体验。iPad也希望如此,只不过它同时还希望以平板电脑的形式替换传统的显示器加键盘的组合,并用多点触控界面代替已经沿用了数十年的WIMP(窗口、图标、目录和指针)界面。

  或许将iPad比作任天堂Wii更为恰当,后者的成功并非源于处理器,而是凭借着创新的界面和渠道广泛的软件获得的。我相信,如果iPad能够像Wii改变游戏机行业那样改变移动计算行业,苹果一定会将其视为一个巨大的成功。
苹果A4芯片规格:
[td=284]

性质

[td=284]

芯片集成系统System on a Chip SoC


[td=284]

设计商

[td=284]

P.A Semi/苹果公司Apple Inc.


[td=284]

制造商

[td=284]

三星电子Samsung Electronics


[td=284]

指令集

[td=284]

ARMv7 (Cortex)


[td=284]

设计结构

[td=284]

Cortex-A8


[td=284]

制造工艺

[td=284]

45纳米


[td=284]

生产代码

[td=284]

三星S5PV210


[td=284]

类似产品

[td=284]

三星S5PC110 (三星i9000,s8500)


[td=284]

图形芯片

[td=284]

PowerVR SGX 535(一说540)

ARM架构与X86架构_第1张图片

相较于 AMD与 Intel, ARM显然对多数的消费者还是很陌生的名词,而多数人也会好奇,ARM架构生产的应用处理器到底跟Intel、AMD又有什么不同,又跟智慧手机与平板厂商提到的 TI OMAP、 Qualcomm Snapdragon、三星的蜂鸟( Hummingbird)、猎户座( Orion)、飞思卡尔( Freescale)的i.MX,或是 ST-Ericsson的应用处理器等有什么关系。

先从ARM这家公司谈起,ARM成立于1991年,是一家出售IP(技术知识产权)的公司,所谓的技术知识产权,就有点像是卖房屋的结构设计图,至于要怎修改,哪边开窗户,以及要怎加盖其它的花园,就看买了设计图的厂商自己决定。

而ARM的架构是采用 RISC架构,如同它的名称一样, Advanced RISC Machines,RISC架构在当初的PC架构争霸战虽然败给Intel所主导的x86处理器架构,却默默在另外的领域成长壮大;小从硬盘转速控制、电信基地台的计算、汽车喷射引擎的控制、音响系统、相机引擎,大到电动机具的控制等等,都能够看见采用ARM授权架构处理器的身影。

而有了设计图,当然还要有把设计图实现的厂商,而这些就是ARM架构的授权客户群,包括上述几家厂商以外,还有如Freescale、联发科、Telechip、新岸线等数不清的大小控制芯片与应用处理器厂商,都是采用ARM架构的授权客户。甚至多年前的Intel的 XScale处理器,也是采用ARM的核心授权。


延伸阅读:

谈谈新窜起新操作系统平台 - Android平板电脑


ARM架构与X86架构_第2张图片ARM的架构相较于x86有哪些特点?相较于基于CISC的x86架构处理器,由于为了满足电脑产业发展而不断加入指令集,使得处理器日益庞大,但每个指令集用到的频率也越差越大,许多指令到后来已经相当少用,甚至是可以被新的指令所取代。而ARM架构则大幅简化架构,仅保留所需要的指令,可以让整个处理器更为简化,拥有小体积、高效能的特性。

另外,ARM的架构老早就已经作到高密度整合,由于ARM授权的弹性以及核心架构单纯,ARM处理器架构可以很容易与其它专职的特殊核心,像是GPU、多媒体译码核心、基频调制解调器、I/O控制等架构整合,透过SoC(System On a Chip,系统单芯片)的方式,一颗小小的ARM架构应用处理器,完成近年x86架构处理器积极跨足的单芯片设计,并且透过各种不同的核心分工各司其职,ARM架构应用处理器的核心负担相较传统x86处理器低上许多,并且因为早前应用处理器的需求就是以低功耗为重点,即便如今效能不断提升,仍是以保有省电的特性为前提发展。

ARM架构的另一个优点,就是自由性,只要像ARM买下核心授权,就可以与其它IP公司的方案以及这家授权客户本身的优势技术整合,虽同为同一世代的ARM核心架构,即便频率相同,结果也不同。不过这也使得ARM应用处理器光从基本规格是不一定能看出操作效能的,例如同样隶属高通Snapdragon,频率1GHz的第一世代旗舰QSD8x50甚至不敌频率仅800MHz的第二世代MSM7230。

以目前最火红的几颗手机与平板的双核应用处理器选择的GPU架构为例,Tegra 2图形架构来自NVIDIA的GeForce ULP,TI OMAP 4430则是采用PowerVR SGX 540架构,Qualcomm MSM8660采用高通自家Adreno 220,三星Exynos 4210采用ARM的Mali 400 GPU架构,就已经足以产生这几颗处理器在效能表现的差异,更不用说细节的内存控制管理、电源管理、储存通道等架构产生的差异。

谈到这些GPU架构,又是一段有趣的过去,GeForce ULP、Power SGX以及Adreno其实都在游戏机史上交手过,Nvidia的图形架构曾被用在微软第一代XBox以及PS3采用过,而PowerVR则是接连在SEGA Saturn以及Dreamcast出现,Adreno源自ATi行动图形部门,ATi的图形方案也被XBox 360以及Wii采用,可说这几家图形方案供货商过去在游戏机的战火,又再次烧回手机以及平板上。

ARM架构与X86架构_第3张图片

ARM的架构之所以在智能手机以及平板能够迅速窜红,苹果iOS装置可说是大功臣,在苹果之前,智能手机在市场上一直载浮载沉,虽然有着号称智能手机平台市占率第一的Nokia Symbian,以及 Windows Mobile、 Palm OS、 BlackBerry等系统,不过当时的环境在缺乏行动网络为后盾,在线商店的概念也还未发展成型;一直到苹果以iPhone打响新世代智能手机第一炮后,市场才真正体认到智能手机原来可以是这么容易使用。

iPhone的出现也间接带起市场对于ARM架构应用处理器的需求,不过光是苹果也无法带起市场对于ARM处理器的需求,如WM(WP7)手机与Symbian也纷纷加入新一代智能手机战局,但是真正成为关键的,是Google Android宣布参战后,其它手机厂商取得一个相较过去成熟的通用智能手机平台,而各厂商又为了进行产品差异化,开始针对ARM架构应用处理器的效能以及硬件支持要求,使得过去发展缓速的ARM架构一下子热络起来,也让ARM架构一夕之间成为火热话题。



你可能感兴趣的:(框架,其他)