0、1969年,脱胎仙童半导体,AMD成立
1968年,仙童半导体的8位创始人中的两位——总经理罗伯特•诺伊斯(Robert Noyce)和实验室负责人戈登•摩尔(Gorden Moore),带着一部分员工离开了陷入资金危机的公司,成立了英特尔(Intel)。而一年后的1969年5月1日,桑德斯也带着7个人另立门户,成立了超微半导体(Advanced Micro Devices, AMD),就是本篇文章的主角AMD。
刚成立的AMD可谓是举步维艰,因为它与Intel的成立虽然只差一年,但劣势明显。Intel的两位创始人早已经是电子业界声名赫赫的大佬,手下也都非等闲之辈,想要吸引到投资和技术人才并非难事。而AMD的启动资金只有区区10万美元,桑德斯本人在IT领域也没有什么号召力,因此起步非常缓慢。
1、1975年,第一款产品AMD2900系列
AMD低调务实的作风使得它发展比较快。它首先由设计简单的IC开始,到了1975年,他们终于有了自己的第一个产品族——Am2900系列,包括ALU、多路复用器、内存控制器、总线控制器等许多部件。这时,AMD的股票也已经上市,并且也有了自己的第一家海外工厂,AMD已经算得上是一家初具规模的企业了。
2 、1976年至1984年,Intel的代工盟友
在上世纪七八十年代,Intel一直扮演着微处理器技术唯一的先驱者的角色。1971年,Intel设计出了第一个4位CPU 4004,1972年是8位的8008,1974年是具有重要意义的8080,1979年则是大名鼎鼎的16位CPU 8086和8088。值得一提的是,AMD在对8080做逆向,并且成功了,命名为Am9080。Intel为了保证产能,与著名电子工程师费德里科•法金(Federico Faggin)的Zilog Z80芯片对抗,在1976年与AMD签订了授权协议,AMD正式成为Intel的第二供应商(second source supplier),也就是类似于代工厂,属于亲密盟友的关系。
但到了1980年,Intel认为AMD产芯片的出货量已经非常大,AMD的存在威胁到了自己的利益,准备撤销对AMD的授权。但是,业界巨头IBM决定在此时进军PC行业,并希望Intel作为自己唯一的芯片供应商。在这种重大利好的驱使(或者说是IBM的胁迫)下,Intel和AMD又在1982年2月签订了新的协议,8086、8087、8088以及后续的80186、80286也授权给AMD生产,以应对快速增长的PC行业的需要。 1982年底,AMD以80286为蓝本制造的Am286处理器面世。比较令人意外的是,Intel将自产的80286芯片的频率设定为6~10MHz,而AMD的Am286则是8~16MHz,带来了可观的性能提升,并且售价相对低廉。AMD的这一做法,对Intel而言是一个不大不小的打击。可以说,AMD的性价比路线,早在三十多年之前就已经确定了。
3、1985年,薄利多销,盟友变对手
面对这样的势头,Intel终于坐不住了,在1985年突然撕毁了协定,中止了32位处理器80386的授权,AMD一纸诉状把Intel告上了法庭。虽然AMD最终胜诉,这场旷日持久、历时4年多的官司却让双方都受害不浅,证人有近百名,各类卷宗积攒起来有几万页,诉讼费高达千万美元。
AMD非常清楚,只要诉讼多进行一天,AMD在微处理器的道路上就落后一天。因此,在走法律途径的同时,他们同时也在进行80386的逆向工作,于1989年完成,在Intel的阻挠下于1991年上市。虽然错过了黄金时机,但AMD把自家的Am386最大速度调到了40MHz,这与80386的33MHz相比又是一个技术上的胜利。1993年的Am486也是如此,在Intel的486DX终于达到100MHz时,AMD却提供了120MHz,还加入了回写cache和分页技术的更好的型号。1994年,AMD的总收入达到了破纪录的20亿美元。
其实从上面已经看出,在较长的一段时间内,AMD求生存的道路比较直接,就是追随Intel,但又加上更有性价比的特征,以薄利多销的方式打开市场。但这条路已经变得越来越不现实,IC的复杂度在急速增长,Intel的高性能奔腾(Pentium)芯片的晶体管数量相对于之前的486几乎是3倍,逆向工程无法实施了。
4、1993年,危机之下自研K5
在危机感的驱动下,AMD的研发部门从1993年开始自主研发K5芯片,并于1996年3月27日投放市场。K5是一个相当新颖(或者说激进)的方案,它采用了高度并行化的29k RISC指令集,这与主流的CISC指令集大相径庭,但同时又提供了非常好的x86前端。其内部则采用了4流水线、5个整数单元和1个浮点单元的设计。为了保证兼容性,K5能够在奔腾的Socket 5/7系列主板上使用。
K5系列 K5的竞争对手是Intel的奔腾Pro系列(于1995年发布)和Cyrix的6x86系列。虽然AMD的工程师们走对了路线,但毕竟经验缺乏,设计过程中的逻辑层数过多,导致K5无法通过大幅提升频率来获得性能优势(最高只到133MHz),并且BPU的分支预测成功率也较奔腾Pro为低。
总体上来讲,它的整数运算性能大约是奔腾200的水平,浮点性能则是奔腾100的水平,但击败了Cyrix的竞品,还是比较中规中矩的。但是由于上市较晚,加上设计上有一定的缺陷,因此销量不大,没有给Intel造成什么威胁。AMD的第一次尝试实在算不上好。
5、1995年,收购NexGen,推出K6与Intel正面交锋
与此同时,硅谷的一家只有60个人的小公司NexGen,却做到了AMD做不到的事情。他们正在研发的Nx686处理器轻松地达到了180MHz的核心频率,性能足以压倒Intel的CPU,而这仅仅是靠IBM的一些微薄的资金资助完成的。NexGen的主席阿提克•拉沙(Atiq Raza),是一位很有才华的巴基斯坦籍科学家。他对自己的产品很自信,但他也很清楚,以目前NexGen的实力,是无法与Intel叫板的。
有意思的是,为NexGen与AMD牵线的,是微软CEO比尔•盖茨。他专门约了拉沙来谈,并且告诉他说AMD有自己的晶圆厂,但目前制造的芯片正在遇到性能瓶颈。拉沙与桑德斯电话交谈之后,被AMD的雄心以及桑德斯的魅力深深地打动,因此决定与AMD展开合作。1995年,AMD斥资6.15亿美元收购NexGen,并将其研发团队并入旗下。以NexGen的Nx686为原型,AMD倾力研制出了新的K6处理器,于1997年春季发售。 更有意思的是,K6的成功,与一位Intel前员工有着密不可分的联系。他的名字叫维诺德•达姆(Vinod Dham),印度籍科学家,也是奔腾芯片的主要研发负责人之一,被称为“The father of Pentium”。1995年,他从Intel离职加入了NexGen,被AMD收购后,也主导了K6的研发工作。
K6拥有880万个晶体管,其针脚仍然符合Socket 7规范,这证明其定位仍然是抢夺奔腾的市场。K6的第一个版本就可以运行在233MHz的核心频率下,具备6发射的超标量流水线,还有更加先进的分支预测技术。并且,它良好的超频性能使得它完全可以与超得更高的奔腾Pro一战。除了上面这些优点之外,它还比较便宜,使得当时的奔腾MMX完全失去了存在价值,甚至让刚刚面世的奔腾2也面临不小的竞争。AMD打了一场漂亮仗。
但是,Intel毕竟不是等闲之辈,它仍然是微处理器市场最领先的领导力量,PII仍然拥有足够的与K6对抗的资本。就在K6发布之后,Intel突然宣布退出Socket 7市场,转而推出了具有专利保护的Slot 1主板,与AMD及其他厂商正式决裂。
AMD牢牢把握住了这次机会,开始在Socket 7上连续刷新自己的K6产品线。从233MHz的Nx686开始,到300MHz的Little Foot、350MHz的Chomper、550MHz的Chomper Extended,这些产品在短短的1年多内先后上市。以Chomper为代表的K6-2新架构,还增加了AMD独有的3DNow!指令集,与Intel的SSE指令集类似,大大提升了图形和多媒体处理所需的浮点性能。另外,AMD还随同K6-2一起提出了“Super 7”的新理念,就是“Socket 7+100MHz FSB+AGP”的集合,引来除Intel外的其他厂商效仿,Slot 1显得愈加封闭。
1999年初,AMD推出了K6家族的最后一个修订版本K6-III,晶体管数量达到了2140万,是K6-2的两倍多,同时还加入了用于节能的PowerNow!新技术。就在4天之后,Intel的奔腾3正式发布。K6-III虽然性能表现仍然不错,但毕竟已经有些廉颇老矣,不适合承担与将来的PIII竞争的重大任务了。
6、1999年,速龙(Athlon)时代的辉煌
1999年6月23日,AMD正式发布采用K7微架构的新一代处理器,系列名称“速龙”(Athlon)。 K7普遍被认为是AMD的黄金时代的起点。 K7,也就是速龙处理器,其内部总线采用了来自DEC授权的EV6总线,频率高达200MHz(当时Intel的竞品为133MHz),第一代的核心频率则从500MHz起步提升至700MHz。K7的前端拥有3个并行的译码器,后端则拥有非常鲁棒的乱序执行部件,以及一套非常先进的三发射超流水线FPU,从根本上解决了浮点运算的老大难问题。第一代K7/速龙采用0.25μm工艺制造,缓存系统则是128KB的内置L1,以及片外的512KB的L2。其接口规范则是Slot A规范,芯片组为AMD 750。 K7第一代“Pluto”刚上市就一鸣惊人,其同频和综合性能超越了Intel立足刚刚稳定的,代号Katmai的第一代PIII。
仅仅5个月后,AMD马上就推出了K75,代号Orion,0.18μm制程,频率范围为550MHz~1GHz。Orion是世界上第一款时钟频率能够达到1GHz的微处理器核心,具有里程碑意义。这正式标志着AMD开始与Intel在微处理器方面同台竞技,并第一次真正取得了优胜。但是,Pluto和Orion的超频潜力不佳,市场反响不错,但销量一般。 很快Intel拿出了新的代号为“铜矿”(Coppermine)的PIII,加入了全速片内L2,凭借800MHz以上的频率,又超越了Orion。不过,Intel为了从频率上压制Orion而仓促搞出的1.13GHz的Coppermine,当时却由于产品质量广泛出现问题而被大量回收,被俗称为“矿渣”,给Intel造成了巨大的心理阴影。
2000年6月,AMD发布了代号为“雷鸟”(Thunderbird)的第三代K7/速龙处理器。其也采用了256KB的全速片内L2,FSB回归100/133MHz,兼容Slot A和Socket A两种接口,晶体管数目达到了3700万。在频率方面,雷鸟可以达到1.4GHz的高频。由于此时K7与PIII的同频表现基本相同,因此频率更高也更便宜的雷鸟更受用户的青睐。在当时,雷鸟Athlon 750搭配VIA KT133主板,价格比Intel的奔腾套装便宜30%,但性能却没有打折扣,迅速席卷了民用PC市场。
另外,为了与Intel的赛扬争夺入门级市场,AMD又推出了代号为Spitfire的“钻龙”(Duron,俗称毒龙)系列,作为速龙的精简版,并且同样以超高的性价比广受好评,同频超越赛扬2。另外,Duron可以通过铅笔破解倍频,直上800MHz,性价比就更加突出。直到Intel在2001年推出了采用著名的PIII-S“图拉丁”(Tualatin)核心的赛扬,毒龙的领先优势才失去。
2001年8月,Intel的基于NetBurst架构的奔腾4系列开始铺货,首批型号代号为Willamette,频率来到了史无前例的2GHz。NetBurst架构的宗旨是采用较长的流水线,通过几乎是暴力提升频率的简单方法来达到提升性能的效果。这是一种大舰巨炮主义的想法,长流水线固然可以提升处理器的潜在能力,但带来的频率和功耗瓶颈也是十分严重的。Willamette的同频性能败于自家的Tualatin和AMD的K7,但毕竟频率较高,因此还是比较有优势。 AMD的动作是:升级目前的K7架构,代号为Palomino,并且速龙系列的名字也换成了Athlon XP。Palomino相对于雷鸟,加入了对Intel SSE指令集的支持,并且SIMD逻辑也有改善,性能提升了15%。
2002年,代号“北木”(Northwood)的制程改进版P4面世,0.13μm制程,FSB和频率大大提升,并且创新性地引入了Intel引以为豪的超线程技术(hyper-threading),Palomino又感受到了空前的压力,AMD有推出K7小修改版Thoroughbred来迎战,超高的性价比仍然留住了一大批忠实用户。
在这两年内,AMD在与Intel进行拉锯战的同时,完成了对微处理器产品线的布局:速龙XP和毒龙主攻桌面高低端市场,速龙4/XP-M和毒龙M主攻移动高低端市场,速龙MP则是服务器市场。虽然在移动端和服务器表现一般,但在桌面端的表现十分抢眼。
2003年初,AMD继续拿K7微架构大做文章,推出了升级版速龙XP,代号Barton和Thorton。Barton在当时的DIY领域俗称为“巴顿将军”,是K7的巅峰之作,也是谢幕之作。Barton的代表型号Athlon XP 2500+,则是当年的一代神U,其性价比极高,超频潜力极佳。在当年,速龙XP 2500+搭配上DDR双通道内存和NVidia nForce 2 Ultra主板,其价格与Intel的赛扬平台相当,但性能则比赛扬强几条街。另外,通过超外频的方式,可以把2500+活活变成3200+,性能生吃Northwood的绝大多数型号,血拼3GHz以上的高端P4,非常凶悍。
总之,AMD与Intel竞争到这个阶段,Intel虽然还占据着CPU市场的主动,但其地位受到了非常严重的冲击。而Intel在P4和NetBurst的弯路中还要继续绕一段时间,在这段时间内,AMD当然也没闲着,他们准备着下一轮的更大的攻势。
7、K8上市,64位CPU普及,AMD进入全盛时期
2003年9月23日,AMD发布K8微架构的新品Athlon 64/64 FX(“速龙64”),与当年早前发布的Opteron(“皓龙”)一起,组成K8大军,对Intel的P4展开猛攻。
Athlon 64/Opteron采用了AMD自家的AMD64架构,是整个微处理器历史上第一款64位CPU,具有划时代的重要意义。它们的代号分别为:SledgeHammer和ClawHammer,可以工作在纯64位模式下,也可以工作在32位模式甚至混合模式下,以用来提供向后兼容性,但同时又不牺牲性能。这种32位向64位平稳过渡的做法赢得了一致的好评,微软的Windows以及各主流的Unix/Linux系统都开始为64位提供良好的支持,AMD为推动32位到64位的进化功不可没。AMD的采用64位x86扩展指令集的这种方式,因为其十分先进便捷,成为了业界标准。Intel搞了很长时间的64位安腾(Itanium)架构轻松地被AMD64击败,后来Intel甚至为自己的64位架构取得了AMD64的授权。大概AMD自己也从来不会想到会有这样一天。
速龙64主打主流桌面市场,64 FX则主打高性能,这也是“FX”这两个字母被AMD用来标榜高性能的开端。两者都采用0.13μm工艺生产,内部集成内存控制器和HyperTransport控制器,流水线长度有所加长,频率约为2~2.4GHz,TDP为89W。虽然性能不错,但由于两者分别需要不同的Socket 754和Socket 940主板支持,并且主流的速龙64还不支持双通道内存,因此虽然得到了好评,但并没有对Northwood构成实质性的威胁。
2004年上半年,AMD吸取了教训之后推出新的改进版K8,代号Newcastle。速龙64和64 FX统一为Socket 939接口,全部支持双通道,NVidia也十分给力地推出了nForce 4主板,K8的势头愈发不可阻挡。 也就是在2004年,Intel基于NetBurst架构的第三代P4E面世(E代表extreme),代号为Prescott。Prescott可以说是历史上争议最大的一个微架构,它的流水线级数从之前的20级,一跃达到了惊人的31级,频率已经接近了4GHz,但事实证明,Intel几乎是完全失败了。Prescott相对于Northwood而言,性能没有提升,而K8大获全胜。Athlon 64 3200+和Athlon 64 FX-55等经典型号疯狂蚕食着Intel在桌面处理器的市场份额,2004年,AMD在桌面处理器领域的份额超过了50%,Intel颓势非常明显。“玩游戏选AMD”已经成为深入人心的口号,AMD进入全盛时期。
2005年5月,这次是Intel,抢先发布了史上第一款双核CPU:奔腾D。不过,奔腾D是由两颗P4的核心共享FSB组成,本质上还是没有摆脱高功耗低性能的怪圈。然而大约一周以后,AMD就祭出了自己的双核心处理器:Athlon 64 X2,代号Toledo/Manchester,制程为90nm。速龙64 X2成功地吊打了奔腾D,皓龙也在服务器领域对英特尔的Xeon造成了巨大的冲击,超高的能耗比使得P4毫无脸面。在家用领域,拥有一片X2 3800+这样的处理器,就相当于拥有了想要的几乎全部性能。而经过高频San Diego修订版的速龙FX系列,也终于推出了双核版本Toledo FX-60,和之后的Windsor FX-62等衍生型号一起,霸占了民用级CPU性能宝座。
当然,占据全面优势的AMD有理由给自己的好产品加上他们认为合适的价格。入门级的X2 3800+当年的价格普遍在2000元以上,最高端的FX型号高达7000元以上,但这也没有阻挡DIYer们的热情,AMD可谓是赚的盆满钵溢。2005年下半年,AMD又发布了主打性价比的“闪龙”(Sempron)系列,代号Palermo/Manila,采用Socket 754接口,超频性能同样上佳。在AMD的攻势下,Intel十分被动,Nocona、Smithfield、Presler、Paxville等架构面对速龙、闪龙、皓龙,只能被认为是仓促发布的产品,全部败下阵来。“64位”和“双核”这两大关键且密集的战役,Intel全都打输了。
与此同时,AMD也不忘为自己取得的胜利造势,公开宣称自己赢得了“双核对决”(dual-core duel)。不仅如此,在2005年,AMD还提起了一项诉讼,指控Intel在微处理器市场使用垄断优势、恶意竞争,以妨害AMD处理器进入市场(虽然事实并非如此),Intel还遭到了调查。AMD的日子简直过得不要太好。
8、Intel推出Core系列开始扭转局势
2006 年 8 月,Intel 展开逆袭,推出了下一代的 CPU──Core 2 系列。新系列的 Intel CPU,断开和 PenTIum 4 的关联,以 Pentium III 的 CPU 硬件架构为基础重新设计,并采用 AMD 所发展的 64 位指令集架构。这一次,Intel 以过往成功的产品为基础并重新设计,以 Core 为名重新出发。Intel 结束产品线的混乱以及产品效能低落的数年。同步多线程,彻底发挥 CPU 核心的计算能力 。
2008 年,Intel 将其 Hyper-Threading 的技术重新导入 Core i 系列 CPU,也就我们现在所熟知的 i3、i5、i7 处理器。所谓的 Hyper-Threading,便是在一个 CPU 核心内部在将其分成两份。采用这一项技术后,在多执行绪的执行情况下,将可带来将近 30% 的效能提升,相当惊人。
2011 年,最为应对,AMD 推出 Bulldozer,其采用的并非是 Intel 所使用的 SMT 技术,而是 Clustered MultiThreaded(CMT)技术。此技术是将一颗 CPU 内部的整数执行单元复制一份,让 CPU 具备在同一核心内部执行两个执行绪能力,在后续要扩增核心的计算能力上,相当的容易,所需要的修改相对的较少。 然而,其缺点便是没有办法共用执行单元,无法享有 SMT 中最重要的优点,用两个 Thread 尽可能让执行单元不会有空闲状态。此外,两个独立的 L1 Cache 虽然感觉在实作上会比较简单。但是,为了要维持 Cache 的一致性,便需要拥有额外的 Core 内部资料交换单元,大大的提升控制电路的复杂性。
最后,结果便是众所皆知的,AMD 于 x86 的 CPU 市占率直直落,现今在中高端的笔电市场中,更几乎看不到采用 AMD CPU 的产品。就在 AMD 要消失在市场之中时,Zen CPU 的消息传出!
9、锐龙(Ryzen)推出,硬件架构的重新设计
2012 年,K8 的主要硬件架构师 Jim Keller 回到 AMD。这一次,他的回归,让 AMD 重返荣耀的声音响起。将底层硬件架构做比较,可以发现 Ryzen CPU,取消了 Bulldozer 所提出的 Integer Cluster,并以类似 Intel Hyper-Threading 的技术取而代之。如此便能让 CPU 尽可能地达到满载的状况。
此外,新的 Ryzen CPU 也引进了 Intel 于 Sandy Bridge 架构开始采用的 Micro-op Queue,以减少重新 Decode 的需求,提升单次可执行的指令数。借由更多先进的技术,让 AMD 得以获得大幅度的效能提升。也因此,AMD 公布 Ryzen CPU 其每个周期可以执行的指令比前一代 CPU 多 52%,改善幅度相当大。
2017年2月21日AMD发布,首批有Ryzen7三款高端型号1700、1700X和1800X。采用AMD 1331针接口,14NM处理器“Ryzen”系列,中文名称为“锐龙”。至于实际的 Ryzen CPU 效能如何呢?现在已经有相当多的评测文章将 Intel Kaby Lake 系列和 Ryzen 系列 CPU 做比较,在这不再多做评比。不过,在一般的应用上,AMD 的 CPU 不会再像之前的 CPU,看不到 Intel CPU 的车尾灯。