深度剖析六大国产CPU

前言

  • CPU 是底层硬件基础设施中的核心,当前主流芯片架构为 ARM 和 X86,均为国外主导,芯片国产化率较低。“十五”期间,国家启动发展国产 CPU 的泰山计划,863 计划也提出自主研发 CPU。
  • 2006 年核高基专项启动,国产 CPU领域迎来新一轮的国家支持,鲲鹏、飞腾、龙芯、兆芯、海光、申威等一批优质国产 CPU 厂商快速崛起。

六大国产CPU厂商概览

深度剖析六大国产CPU_第1张图片

指令集架构

主要架构 x86 ARM MIPS Alpha
架构特征 1、指令系统庞大,功能复杂,寻址方式多,且长度可变,有多种格式 2、各种指令均可访问内存数据 3、一部分指令需多个机器周期完成 4、复杂指令采用微程序实现 5、系统兼容能力较强 1、指令长度固定,易于译码执行 2、大部分指令可以条件式地执行,降低在分支时产生的开销,弥补分支预测器的不足 3、算数指令只会在要求时更改条件编码 1、采用 32 位寄存器 2、大多数指令在一个周期内执行 3、所有指令都是 32 位,且采用定长编码的指令集和流水线模式执行指令 4、具有高性能高速缓存能力,且内存管理方案相对灵活 1、采用 32 位定长指令集,使用低字节寄存器,占用低内存地址线 2、分支指令无延迟槽,使用无条件分支码寄存器
架构优势 x86 架构兼容性强,配套软件及开发工具相对成熟,且 x86 架构功能强大,高效使用主存储器,在处理复杂指令和商业计算的运用方面有较大优势 ARM 结构具有低功耗、小体积的特点,聚焦移动端市场,在消费类电子产品中具有优势 MIPS 结构设计简单、功耗较低,在嵌入式应用场景具有优势 Alpha 结构简单,易于实现超标量和高主频计算
主要应用领域/使用场景 服务器、工作站和个人计算机等 智能手机、平板电脑、工业控制、网络应用、消费类电子产品等 桌面终端、工业、汽车、消费电子系统和无线电通信等专用设备等 嵌入式设备、服务器等
国内主要应用厂商 海光信息、兆芯 华为鲲鹏、飞腾 龙芯中科 申威

六大国产CPU对比

对比指标 海光 龙芯 鲲鹏 飞腾 兆芯 申威
合作方/资方 AMD/中科曙光 中科院研究所 华为 天津飞腾/CEC VIA/上海国资委 江南计算所/CETC
指令集体系 X86(AMD) LongISA2.0+MIPS ARMv8 ARMv8 X86(VIA) ALPHA,SW-64
架构来源 IP 授权 指令集授权+自研 指令集授权 指令集授权 IP 授权 指令集授权+自研
产品覆盖领域 服务器 桌面、服务器 服务器、桌面、嵌入式 服务器、桌面、嵌入式 服务器、桌面、嵌入式 服务器、桌面
代表产品 海光 1 号、海光 2 号、海光 3 号、海光 4 号 龙芯 1 号、龙芯 2 号、龙芯 3 号 鲲鹏 920 腾云 S 系列、腾锐 D 系列、腾珑 E 系列 ZX-C、ZX-D、KX-5000、KX-6000、KH-20000 SW1600、SW1610、SW26010
应用市场 党政+商用 党政市场 党政+商用 党政+商用 党政+商用 军方+党政
优势 X86 最新授权,性能较强,应用生态丰富 起步最早,适配厂商多,自主化程度高 ARM 前景广阔;产品线极其丰富,性能最强;党政+商用市场接受程度高 ARM 前景广阔;产品线丰富,性能不断提升;架构层级授权自主化程度较高 上海地区覆盖广,x86 应用生态丰富 在军方市场占有率高,底层应用、超算为主力方向
劣势 目前自主化程度相对低;股权结构复杂;无桌面授权 MIPS 生态应用匮乏、性能一般,不利于商用市场拓展 受制裁中,未来存在不确定性 产品起步晚,性能相对弱势 早期的 x86 内核层级授权,市场开拓不足 超算为主要方向,商用产品开发不足
厂商 服务器:中科曙光 台式机:曙光、联想、方正、同方等; 服务器:云海麒麟、五舟科技、清华同方、长城等; 笔记本:方正同方、山东超越、北京计算机研究所等 服务器:华为 台式机:长城;笔记本:长城; 服务器:清华同方、浪潮、联想、长城等 台式机:联想、同方;笔记本:联想; 服务器:云海麒麟、火星舱、联想、秉时 服务器:ZoomServer、云海麒麟、联想、方正、宝德等
实际应用 国家级超算项目 玲珑、逸珑、福珑、北斗导航卫星 华为服务器 天河一号、天河二号、天河三号 笔记本、服务器、 火星舱存储系统 神威蓝光、神威-太湖之光
代工厂 格罗方德、三星 意法半导体 台积电 台积电 台积电 中芯国际
最小制程 14nm 28nm 7nm 16nm 16nm 28nm

兆芯—合资 CPU 的探路者

  • 兆芯是成立于 2013 年的国资控股公司,总部位于上海张江,在北京、西安、济南等地设有子公司,公司同时掌握中央处理器、图形处理器、芯片组三大核心技术,具备相关 IP 自主设计研发的能力。公司坚持自主创新与兼容主流的发展路线,凭借成熟的软硬件生态,为用户提供性能卓越、兼容性优异且安全可靠的通用处理器和芯片组等产品。
  • 自成立以来,公司已成功研发并量产多款通用处理器产品,并形成“开先”、“开胜”两大产品系列,产品性能不断提升,达到国际主流同等水平。作为国内率先实现主频3.0GHz 关键突破的国产通用处理器,兆芯开先® KX-6000 系列处理器荣获“第二届集成电路产业技术创新奖”、“2019 年中国 IC 设计成就奖”和“第二十届中国国际工业博览会金奖”,并入选“2019-2020 年度上海设计 100+”优秀成果。
  • 兆芯产品体系与解决方案

深度剖析六大国产CPU_第2张图片

  • 兆芯自主研发的通用处理器产品涵盖“开先”、“开胜”两大系列,具备良好的操作系统和软硬件兼容性,生态体系成熟,支持构建台式机、笔记本、一体机、云终端等多种类型的桌面整机以及服务器、存储等产品。此外,在嵌入式领域,也已经有不同规格基于兆芯通用处理器的工业主板、模块化电脑、工业整机、Box PC、工业级服务器、网络安全平台等产品陆续推出。
  • 兆芯产品系列
    深度剖析六大国产CPU_第3张图片
  • 在芯片设计研发和技术创新方面,兆芯自主创新研发的国产通用处理器性能稳定可靠,产品体验达到国际主流同等水平。在产业链合作方面,兆芯积极协同产业合作伙伴,为政府、金融、教育、交通、能源、网络安全、医疗、通信等行业提供多样化的产品和解决方案,助力客户应用实现平滑迁 移,目前,基于兆芯新一 代处理器
    (KX-6000/KH-30000),联想、同方、东海、海尔、锐捷、升腾、攀升等品牌已经推出了 20 余款不同形态的桌面 PC 及服务器产品,研华、研祥、盛博、威强电、信步、安勤、深惟、华北工控、汉智兴、智微、芯杰英、经纬天地、凌壹、海川智能、爱鑫微、众新等 30 多种工业主板、工业电脑模块和嵌入式计算平台,此外 30 多种网络安全平台也相继推出。
  • 开先 KX-6000/开胜 KH-30000 系列处理器是业内第一款完整集成 CPU、GPU、芯片组的SoC 单芯片国产通用处理器,这为整机系统的开发提供了较大的便利条件,同时也更利于控制成本。
  • 通过 KX-6000 系列处理器横向对比,8 核心的 KX-U6780A 产品性能与第七代的 4 核心英特尔 i5 整体水平仍存在差距,尤其是单核性能不足 7 代 i5 一半,但整数性能方面对英特尔 i5 实现了反超。
  • 兆芯 KX-6000 系列处理器横向对比 深度剖析六大国产CPU_第4张图片
  • 开先 KX-6000/开胜 KH-30000 系列处理器采用了新一代高速低功耗内核。新一代内核对宏指令和多媒体性能进行了进一步的优化和增强,针对微架构流水线也进行了大幅的改进和优化,加上功耗方面的优化以及高频物理实现和高频防抖/降噪控制等方面的改善,开先 KX-6000/开胜 KH-30000 系列处理器的单芯片性能相比上一代产品提升了多达 50%,同频下的性能功耗比则是上代产品的 3 倍。

海光信息—性能领先的实干者

  • 海光信息成立于 2014 年,主要从事高端处理器、加速器等计算芯片产品和系统的研究开发。海光处理器兼容市场主流的 X86 指令集,具有成熟而丰富的应用生态环境。海光处理器内置专用安全硬件,支持通用的可信计算标准,能够进行主动安全防御,最大程度避免安全漏洞和隐患,满足信息安全的发展需求。面向企业计算、云计算数据中心、大数据分析、人工智能、边缘计算等众多领域,公司提供了多种形态的海光处理器芯,满足互联网、电信、金融、交通、能源、中小企业等的广泛应用需求。从股权结构上看,主要从事研究、开发、生产制造高性能计算机、通用服务器及存储产品的中科曙光是公司的第一大股东,二者的深入合作为海光信息的生态打造提供了有力保障。
  • 海光信息与 AMD 公司合作密切。2016 年,AMD 公司和海光信息合资成立了成都海光微电子技术有限公司和成都海光集成电路设计有限公司,授权海光微电子 x86 指令集和Zen 架构,AMD 获得 2.93 亿美元的授权费。海光集成电路购买海光微电子的 IP 授权,以此为基础开发 CPU。海光集成电路与海光微电子的股权结构保证了公司在规避了英特尔的 x86 授权限制的同时,又使得海光 x86 CPU 成为内资公司开发的产品,满足了国家产业政策和创新的需求。
  • 海光 CPU 主要面向复杂逻辑计算、多任务调度等通用处理器应用场景需求,兼容国际主流 x86 处理器架构和技术路线,具有先进的工艺制程、优异的系统架构、丰富的软硬件生态等优势。此外,海光 CPU 支持国密算法,扩充了安全算法指令,集成了安全算法专用加速电路,支持可信计算,大幅度提升了高端处理器的安全性,可以在数据处理过程中为用户提供更好的安全保障。
  • 海光CPU主要规格和特点
    深度剖析六大国产CPU_第5张图片
    深度剖析六大国产CPU_第6张图片
  • 电信和金融已成为公司产品应用最多的两个领域。近年来公司推出海光二号处理器、深算一号 DCU 处理器,不断丰富产品线,加大市场开拓力度,逐步形成了较为完善的基于海光处理器的产业生态环境。基于前期电信、金融、互联网等行业对公司产品的认可,公司在电信运营商集采、金融行业入围等方面市场份额增长较快,公司产品在相关重点行业销量逐渐提升。
  • 公司产品基于 AMD Zen1 架构,产品性能起点较高。选取 Intel 在 2020 年(与海光7285 同期)发布的 6 款至强铂金系列产品(能够反映 Intel 2020 年发布的主流 CPU产品的性能)与海光 7285 进行性能对比可以发现,在典型场景下,公司最新一代 CPU相关产品均已接近国际同类高端产品水平。
  • 海光 7285 与 Intel 至强铂金系列产品对比
    深度剖析六大国产CPU_第7张图片
  • 海光信息的基础架构具备先天生态优势。微软和英特尔凭借自身规模效应和技术优势,使 Windows 和 Intel CPU 占据了绝大部分市场份额,并结成 Wintel 联盟。Wintel 联盟的基本特点是基于 x86 架构优化各类软件应用,使得 x86 架构具有显著产业生态优势,同时软硬件环境的成熟度相较于其他架构也具有明显优势。我们认为海光 CPU兼容 x86 指令集,使得其具备较高的应用兼容性,较低的迁移成本,有望受益于 x86完备的生态体系。
  • 公司第一大股东中科曙光与公司的发展形成良好的协同效应。中科曙光的业务结构主要包含高性能计算机(包括服务器和其相关配套产品)、存储产品以及围绕高端计算机的软件开发、系统集成与技术服务三大类别。海光提供性能优异的国产 CPU,为曙光的战略转型提供支点。中科曙光通过在计算产业的全面布局已具备优质的客户资源和销售渠道,曙光服务器中应用海光产品的比例超过 30%,为海光芯片的放量打下了深厚基础。

华为鲲鹏—快速崛起的领导者

  • 华为芯片基于 ARM 架构,研发五大芯片族,实现全场景布局。华为自研芯片产品主要包括服务器芯片鲲鹏系列、手机 SOC 芯片麒麟系列、人工智能芯片昇腾系列、5G 基站芯片天罡系列、5G 终端芯片巴龙系列等,以及一系列专用芯片,如凌霄芯片、NB-IoT芯片、视频编码解码芯片以及 SSD 控制芯片等。
  • 华为芯片全景图
    深度剖析六大国产CPU_第8张图片
  • 鲲鹏处理器基于 ARM v8 指令集永久授权,自主研发设计处理器内核,兼容全球 ARM生态,并围绕鲲鹏处理器打造了“算、存、传、管、智”五个子系统的芯片族,实现全场景处理器布局。华为从 2004 年开始投资研发第一颗嵌入式处理芯片,迄今形成了以“鲲鹏+昇腾”为核心的基础芯片族。当前,Kunpeng 芯片族正沿着“量产一代、研发一代、规划一代”的策略持续升级产品。
  • Kunpeng 芯片族策略
    深度剖析六大国产CPU_第9张图片
  • 2019 年华为发布鲲鹏 920 处理器。该芯片支持 ARMv8.2 指令集,是行业内首款 7nm数据中心 ARM 处理器,专为大数据处理以及分布式存储等应用而设计。鲲鹏 920 由华为自主研发,采用多发射、乱序执行、优化分支预测等多种手段提升单核性能。鲲鹏920 拥有 64 个内核,集成 8 通道 DDR4,可以提供多个接口,主频可达 2.6GHz,总内存带宽最高可达 1.5Tb/s,支持 PCIe 4.0 及 CCIX 接口,总带宽 640Gbps。华为 Cache一致性总线(HCCS)的 480Gbps 片间互联支持最多四颗鲲鹏 920 互联和最高 256 个物理核的 NUMA 架构,保证了鲲鹏 920 超强算力的高效输出。此外,在 Memory 子系统上也进行了大量的优化,采用当前典型的 3 级 Cache 的架构,对 Cache 大小以及延时进行了优化设计。
  • 鲲鹏 920 处理器关键特性
    深度剖析六大国产CPU_第10张图片
  • 非 X86 架构芯片中鲲鹏 920 芯片在算力维度方面优势领先,且发展至今已经达到可以与 X86 芯片相匹配的性能。参照鲲鹏 920 不同核心下与竞品芯片的对比,其在 48 核的时候,整数打平 intel 至强 8180,功耗低 20%。而 64 核心的鲲鹏 920,则比过 intel至强 8180 33%左右。其中至强 8180 是 intel 用于服务器的旗舰芯片,采用 28 核心,2.5GHz 频率,广泛应用于 X86 服务器中。
  • 鲲鹏计算产业将快速提升 Kunpeng 处理器生态建设。鲲鹏计算产业是基于 Kunpeng处理器构建的全栈 IT 基础设施、行业应用及服务,包括 PC、服务器、存储、操作系统、中间件、虚拟化、数据库、云服务、行业应用以及咨询管理服务等。鲲鹏计算产业路线是华为提出的六大数字技术生态之一,除鲲鹏外还包括昇腾、HMS、鸿蒙、华为云、MDC(智能驾驶计算平台)。其中鲲鹏是华为面向政企市场,与地方政府和合作伙伴共同打造鲲鹏产业生态、构建具有国际竞争力的通用计算技术路线。
  • 基于 Kunpeng 处理器的鲲鹏计算产业
    深度剖析六大国产CPU_第11张图片
  • 鲲鹏计算产业生态不断扩大,赋能 Kunpeng 处理器长远发展。鲲鹏计算产业打造完备基础产品,开放硬件、开源软件,充分赋能合作伙伴,此外鲲鹏还有望带动国内软硬件领域的厂商加速发展。
  • 鲲鹏计算产业首批厂家
    深度剖析六大国产CPU_第12张图片

飞腾—PKS 生态的主导者

  • 飞腾信息技术有限公司由中国电子信息产业集团、天津市滨海新区政府和天津先进技术研究院于 2014 年联合成立。公司致力于飞腾系列国产高性能、低功耗通用计算微处理器的设计研发和产业化推广,同时联合众多国产软硬件生态厂商,提供基于国际主流技术标准、中国自主先进的全国产信息系统整体解决方案,支撑国家信息安全和重要工业安全。
  • 2020 年以来,飞腾对高性能服务器 CPU、高效能桌面 CPU、高端嵌入式 CPU 三条产业线进行了全面的品牌升级。高性能服务器CPU产品线统一以飞腾腾云S系列进行命名,高性能桌面 CPU 产品线以飞腾腾锐 D 系列进行命名,高端嵌入式 CPU 产品线统一以飞腾腾珑 E 系列进行命名,提供定制化、契合各行各业嵌入式应用的解决方案。
  • 飞腾经过 20 年技术积累产品线完善
    深度剖析六大国产CPU_第13张图片
  • 公司于 2020 年发布的腾云系列新一代可扩展多路服务器芯片腾云 S2500 与 FT 2000+相比性能大幅提升。在整机性能方面,双路的 SPECint 分值为原来的 2 倍,四路的SPECint 值为原来的 3.5 倍;在分布式数据库性能方面,双路服务器的 tpmc 值线性提升至原来的 2 倍,四路的 tpmc 值线性提升至原来的 4 倍;在云桌面支持方面,双路服务器支持虚拟机 70 个,是原来的 2.5 倍,四路服务器支持 140 个,是原来的 5倍。
  • 相比上一代产品 FT-2000/4 桌面处理器芯片,最新飞腾高效能桌面 CPU 腾锐 D2000的性能大幅跃升,带宽达 18.7GB/s,SPECint 分值为 97.45,SPECfp 分值为 94.62,接近原来的 2 倍,在计算能力上得到进一步提升,并兼顾桌面终端与边缘服务器,极大地丰富了应用场景。此外,腾锐 D2000 与 FT-2000/4 产品管脚兼容,用户可以实现现有系统的原位拔插代换、无缝兼容。此设计能够大幅降低产品研发成本,同时降低整机合作伙伴的开发难度,加快开发进度。
  • 飞腾生态发展迅速,为行业自主创新做出了重要贡献。在生态建设方面,飞腾与 1600余家国内软硬件厂商打造完整生态体系,与 6 大类 1000 余种整机产品,2600 余种软件和外设完成了适配;基于飞腾桌面 CPU 的终端已形成了较为完整的生态图谱,可覆盖从整机硬件、基础软件到上层的应用。基于飞腾桌面 CPU 的终端产品已能够实现海量 Android 应用的运行,基于飞腾 CPU 的软件生态也在不断丰富和完善。
  • 飞腾部分生态合作伙伴
  • PKS 体系领导者,已成为行业生态构建的标杆。PKS 体系最早由飞腾 CPU(Phytium)和麒麟操作系统(Kylin)的“PK 体系”发展而来。依托飞腾全新的硬件级安全机制,以相关可信技术为支撑,PK 体系融合“S-Security”的立体防护安全链,升级为 PKS体系,并全球首创将“可信计算 3.0”技术融入到 CPU、操作系统和存储控制器中,实现底层构架的本质安全,并成为国内首个计算机软硬件基础体系标准。
  • PKS可信架构
    深度剖析六大国产CPU_第14张图片
  • 对比鲲鹏与飞腾的生态构建可以发现,鲲鹏技术路线比 PKS 路线有较明显的技术和产品优势,PKS 技术路线比鲲鹏技术路线有较明显的安全优势。鲲鹏在硬件终端、云平台、人工智能、中间件等方面具有绝对优势,但在安全方面略逊一筹。PKS 路线的一个非常显著的特点是“注入安全”,即“PKS”体系中的“S”,PKS 路线将安全贯穿于从 CPU、OS 底层,到产品服务应用,一直到供应链安全保障的全过程,为信创工程提供内生安全、过程安全和供应链安全的全流程服务。
  • 鲲鹏计算产业与 PKS 技术路线对照表
    深度剖析六大国产CPU_第15张图片

龙芯中科—自主架构的先驱者

  • 龙芯中科是中国科学院计算所自主研发的通用 CPU,采用自主 LoongISA 指令系统,兼容 MIPS 指令,所有 IP 模块皆为自主设计,拥有片内安全机制,可信性高。龙芯处理器以 32 位核 64 位单核及多核 CPU/SOC 为主,主要面向高端嵌入式、个人电脑、服务器和高性能机等应用。2002 年 8 月诞生的“龙芯一号”是我国首枚拥有自主知识产权的通用高性能微处理芯片。龙芯从 2001 年至今共开发了 1 号、2 号、3 号三个系列处理器和龙芯桥片系列,在政企、安全、金融、能源等应用场景得到了广泛应用。
  • 公司产品体系分为三大系列,龙芯 1 号系列为低功耗、低成本的专用嵌入式 SoC 或MCU 处理器,主要面向嵌入式专用应用领域,如物联终端、仪器设备、数据采集等,主要根据需求定制;龙芯 2 号系列为低功耗通用处理器,采用单芯片 SoC 设计,应用场景面向工业控制与终端等领域,如网络设备、行业终端、智能制造等,定位于 Intel的凌动系列;龙芯 3 号系列为高性能通用处理器,通常集成 4 个及以上 64 位高性能处理器核,与桥片配套使用,应用场景面向桌面和服务器等信息化领域,对标 Intel的酷睿/至强系列。
  • 龙芯中科产品体系
    在这里插入图片描述
    深度剖析六大国产CPU_第16张图片
    深度剖析六大国产CPU_第17张图片
  • LoongArch 具有较强的扩展性和自主性。LoongArch 包括基础架构部分和向量指令、虚拟化、二进制翻译等扩展部分近 2000 条指令,具有较好的扩展性。自主性方面,LoongArch 指令系统从整个架构的顶层规划,到各部分的功能定义,再到每条指令的编码、名称、含义,都进行了自主设计,具有充分的自主可靠性。此外,LoongArch充分考虑兼容需求,在定义时充分考虑了 MIPS、X86、ARM、RISC-V 等主要指令系统的特征,摒弃了传统指令系统中部分不适应当前软硬件设计技术发展趋势的陈旧内容,吸纳了近年来指令系统设计领域诸多先进的技术发展成果。同原有兼容指令系统相比,不仅在硬件方面更易于高性能、低功耗设计,而且在软件方面更易于编译优化和操作系统、虚拟机的开发。
  • LoongArch 架构优势
    深度剖析六大国产CPU_第18张图片
  • 基于自主指令系统(LoongArch)的 3A5000/3B5000 是龙芯当前重点发展产品。龙芯3A5000/3B5000 是面向个人计算机、服务器等信息化领域的通用处理器,基于龙芯自主指令系统(LoongArch)的 LA464 微结构,并进一步提升频率,降低功耗,优化性能。在与龙芯 3A4000 处理器保持引脚兼容的基础上,频率提升至 2.5GHz,功耗降低30%以上,性能提升 50%以上。龙芯 3B5000 在龙芯 3A5000 的基础上支持多路互连。
  • 龙芯秉承独立自主和开放合作的运营模式,从指令集/IP 核授权、到芯片级/主板级开发以及系统内核应用等方面对生态伙伴进行全方位的开放支持,帮助生态伙伴进行技术创新升级。目前龙芯的信息化合作伙伴达到上千家,可以提供基于龙芯从端到云的完整解决方案。相关软硬件开发人员数万人,已经形成强大的产业链与生态支撑能力。
  • 龙芯生态
    深度剖析六大国产CPU_第19张图片
  • 龙芯开源社区(www.loongnix.cn)是龙芯 CPU 的基础软件生态建设平台,由龙芯中科组织并联合产业链合作厂商、国际开源软件社区及开源爱好者共同参与建设。社区以“开源、开放”的形式进行管理,设置 BIOS、Linux 内核、GCC 编译器、Java 虚拟机、浏览器、媒体解码库、图形桌面、KVM 虚拟机等重要基础软件项目。经过多年建设,信息化应用中的主流编程语言和开发环境已在龙芯平台上得到支持。
  • 龙芯的开源社区建设
    深度剖析六大国产CPU_第20张图片

申威—特种领域的引领者

  • 成都申威科技有限责任公司成立于 2016 年,公司依托国家信息安全发展战略,主要从事对申威处理器的产业化推广,核心业务包括申威处理器芯片内核、封装设计、技术支持服务及销售,小型超级计算机研发、测试、销售、服务及核心部件生产,基于申威处理器的软件、中间件开发,嵌入式计算机系统定制化产品服务,集成电路 IP核等知识产权授权。
  • 申威处理器以 Alpha 指令集为基础进行拓展,高度自主可控。Alpha 指令集由美国 DEC公司研制,主要用于 64 位的 RISC 微处理器。DEC 公司后被美国惠普收购,无锡江南计算所购买了 Alpha 指令集的所有设计资料。江南计算所基于原来的 Alpha 指令集,开发出了更多的自主知识产权的指令集,并研制了申威指令系统,推出了申威处理器。申威处理器是在国家"核高基"重大专项支持下,由上海高性能集成电路中心研制的全国产处理器。首颗申威处理器代号“SW-1”,于 2006 年研制成功,“SW-1”基于 DEC公司 Alpha 架构,130nm 制程,主频为900MHz。
  • 申威主要产品系列
    深度剖析六大国产CPU_第21张图片
    深度剖析六大国产CPU_第22张图片
  • 出于安全性能以及知识产权角度,申威在研发出第一代基于 Alpha 指令集的 CPU 后,将指令集替换为自研的自主可控申威 64 位指令集,完全区别于原有 Alpha 指令集。申威处理器专注于高性能计算,尤其是在服务器领域,浮点运算算力与同期外国处理器相当。申威 SW26010 是中国首个采用国产自研架构且性能强大的计算机芯片。
  • 申威 26010 性能对比
    深度剖析六大国产CPU_第23张图片
  • 申威 26010 处理器的峰值性能大于每秒 12.5 万万亿次浮点运算结果,峰值速度、持续性能、性能功耗比排在世界前列。在 2016 年法兰克福世界超算大会上,“神威·太湖之光”搭载该处理器登顶国际 TOP500 榜单之首。随后,我国科研人员依托“神威·太湖之光”超级计算机的应用成果首次荣获“戈登·贝尔”奖,实现了我国高性能计算应用成果在该奖项上零的突破。
  • 申威在服务器领域向上至超算领域的应用场景中性能强大,优势较为明显。2016 年 6月 20 日,搭载了 40960 颗申威 SW26010 并运行国产操作系统神威睿思的神威太湖之光获得全球超级计算机第一名,神威太湖之光峰值计算速度达每秒 12.54 亿亿次,是全球首台峰值计算速度超过十亿亿次的超级计算机,持续性能为每秒 9.3 亿亿次,软件硬件并行,均为申威自主设计。
  • 申威处理器在超算领域的应用
    深度剖析六大国产CPU_第24张图片
  • 申威 8A 芯片采用最新的第四代申威处理器核心(简称 Core4)。Core4 核心继续采用超标量流水线结构,支持乱序发射、乱序执行、推测执行,并首次采用 SMT 技术,支持每个核心同时运行两个线程。申威 831 相比上一代 4 核 CPU 申威 421 在功耗相当的前提下,性能提升 2 倍以上,下一代产品申威 4E 相比申威 831 性能再提升 50%以上,与 Intel 中端桌面处理器相当;申威下一代服务器产品威鑫 8A 与 Intel 中端服务器处理器相当。
  • 经过长期稳定的研发,基于系列申威芯片的各种产品也逐渐增多,在保障特种领域应用和国家战略任务的前提下,随着其产品技术的日益成熟,其生态也不断完善。同时,申威 CPU 的各种开发支撑系统也日趋成熟。
  • 申威生态
    深度剖析六大国产CPU_第25张图片
    深度剖析六大国产CPU_第26张图片

特别说明

  • 本文章参考《国金证券CPU行业研究报告》,旨在让大家能对国产CPU及其厂商有更深的了解,无任何商业用途。版权归国金证券股份有限公司所有。如有侵权,请联系删除。转载请注明版本归属。

你可能感兴趣的:(实用框架,国产CPU)