Intel下世代绘图结构公开 效能能达到3倍

事前没有任何的警讯,Intel 就在自家网站悄悄地公布下一世代 10nm 代号 Ice Lake 处理器,预计整合的内建显示绘图架构 Gen11 白皮书。白皮书当中不仅有 Gen11 的详细信息,GT2 版本预计提供 1TFLPOS 运算能力,另外也可以稍微窥探 Ice Lake 处理器的变与不变。长久以来,Intel 内建显示绘图一直都被玩家视为鸡肋般的存在,直到近几年加入相当优秀的视讯硬件加速编、译码功能,才让人感受到它的存在。在去年所举办的 Architecture Day 当中,Intel 宣示下一世代的内建显示绘图的效能将有爆炸性的提升,能够游玩一些休闲游戏,最常采用的 GT2 配置将有 1TFLOPS 运算效能。GDC 举行期间,Intel 悄悄地于自家网站公布 Intel Processor Graphics Gen11 Architecture 白皮书,内容长达 33 页,颇为详尽地完整介绍 Gen11。该份白皮书主要针对 GT2 配置撰写,在 Gen11 GT2 配置当中,EU 数量将从 Gen9 GT2 的 24 个大幅提升至 64 个,若是不计较 Gen11 其它架构变化,运算效能至少是现今 Gen9 GT2 的 2.66 倍。

由于 Gen11 与处理器 SoC 其它部分一同建构在硅晶圆上,因此也会揭露些许下一世代 10nm 制程代号 Ice Lake 处理器的信息。即便陆续有实体核心数量将提升至十个的消息传出,Ice Lake 内部多个区块的信息交换依旧采用 ring 总线,包含连接处理器核心、LLC、System Agent,以及本文重点 Gen11 绘图显示区块。LLC 容量依旧可让处理器与绘图核心共享使用,但白皮书内并未指出 Ice Lake 的 LLC 配置大小,尚待决定。

Gen11 GT2 配置有 1 个 Slice,每个 Slice 内部 Sub-Slice 从 Gen9 的 3 个大幅提升至 8 个,但 Sub-Slice 内部 EU 数量保持 8 个不变,单个 Slice 还有一些固定功能单元以及大家一起共享的区块,如 Media Fix Function 区块用以视讯编译码、Slice Common 则包含光栅单元、Z 轴剃除、像素配发与后端引擎等。Media Fix Function 媒体固定功能区块与 Gen9 或是 Gen9.5 差不多,包含 Multi-Format Codec(MFX)、Visual Quality Enhancement(VQE)、Scaler and Format Conversion(SFC)等单元,但 MFX 单元从 Gen9 的 1 个变成 2 个,除了能够同时处理编码、译码之外,同一视讯串流工作也可以分给 2 个 MFX 同步进行,如此即可降低该单元的运作频率加强省电性。MFX 的 VP9 译码功能因应 HDR 所需,位深度进阶至 10bit,且 HEVC 和 VP9 的色度抽样支援 4:2:2 和 4:4:4,编码部分则加入 VP9 支持性与提升 HECV 编码压缩时的画质表现,VQE 单元同样将硬件去噪点的处理位深度提升至 10bit。位于 System Agent 的视频控制器,Gen11 支持 Panel Self Refresh 面板自我更新省电功能,USB Type-C 子系统则能够透过 Type-C 输出视讯画面,并支持 DisplayPort Adaptive Sync。更多详细信息:

http://www.cafes.org.tw/info.asp

 

Gen11 Slice 还有个架构上的改进,Shared Local Memory 从 Slice L3 移出,移入 Sub-Slice 内部,每个 Sub-Slice 共享 64KB。此举可提升存取 Shared Local Memory 的效率,因为不用再透过 Data port 从 L3 取出。

深入 EU 结构,每个 EU 内部包含 2 个 SIMD 处理运算类型的 Arithmetic Logic Unit(ALU),每个 ALU 可并行处理 4 个 32bit 浮点或是整数运算,16bit 则提升至 8 个。EU 每个频率周期可处理 16 个 FP32 浮点运算(2 ALU x SIMD-4 x 2 Op (Add + Mul)),FP16 运算则是再加倍。

绘制技巧部份,Gen11 导入 Coarse Pixel Shading(CPS),原理与现在受到瞩目的 Variable Rate Shading 相当类似,可透过降低 shading rate 减少运算量,实作上却更进步一些。CPS 可将整体画面依据需求分割成 1x1~4x4 区块进行绘制,但除了色彩着色频率比较低之外,对象依旧可以保持清晰边缘。

Gen11 另外还支持 Position only Tile-Based Rendering(PTBR),众所周知 tile-based 渲染方式只需要处理小范围画面,因此运算所需数据减少至可以放入更接近运算处理管线的快取区当中,减少对于内存带宽的需求,这对于分享计算机内存作为绘图专用内存的内建显示绘图而言,能够减少因带宽不足带来的效能损失。 透过升级至 Gen11 GT2,Intel Ice Lake 处理器内建显示绘图效能预计可以和 AMD Ryzen 3 2200G 的 Radeon Vega 8 相提并论,对于 AMD 今年下半年具有一定程度的压力,特别是新一代 Ryzen APU 预计不会这么快跟随桌上型 Ryzen 3000 系列处理器问世。当然除了 Gen11 内建显示改朝换代之外,玩家也会期待独立显示适配器 Xe 的到来。

你可能感兴趣的:(Intel下世代绘图结构公开 效能能达到3倍)