索尼在前段时间透露了 PS5 的相关核心技术特性,详解了这些技术的创新和优势之处。不过由于是面向专业认识的发布会,PS5 的这些特性如今出现了多种不同的解读。PS5 首席架构师马克·塞尔尼(Mark Cerny)之后联系了知名游戏技术分析媒体 Digital Foundry,跟他们聊了聊更多关于已经公布的这些重点技术的细节,让我们对 PS5 的硬件有一个更加细致的了解。
原文标题:PlayStation 5 uncovered: the Mark Cerny tech deep dive,作者:Richard Leadbetter。
注:因原文涉及很多专业技术细节,为达到较好的阅读效果,本文做了大规模的编译,尽可能简单清晰。
PS5 的 GPU 频率让非常多人感到吃惊。2.23GHz 的频率是民用 PC 显卡很难达到的超高频率,让大部分人都怀疑这个频率其实并不可靠。
不过当我们仔细考虑索尼对 CPU 和 GPU 频率的表述时,我们会发现事情可能并不简单。
索尼给 PS5 标注的 CPU 和 GPU 的频率皆为“极限”频率,也就是说它的频率会下降。从我们目前对 PC 和手机的变频技术的了解,这不就是就因为过热或者是将要出现过热而导致的性能下降吗?从以往的情况来看,我们都倾向于这一种解释。
但这次并不一样,PS5 的频率下降从技术原理来讲并不是因为发热导致被迫降低,而是因为内部系统的主动调整。倘若 PS5 因为过热出现降频情况,那么系统性能就处于不可靠的状态,对开发者而言是极不友好的。
索尼当然考虑到了这点,在 AMD 的帮助下,让 PS5 的 CPU 和 GPU 在各自的频率区间范围内维持整体可控的稳定表现。
一般来说,PC、手机等设备会给处理器设定温度上限,一旦温度超过或者超过该温度一段时间它就会为了避免过热而强制降低频率。为了保持游戏主机的整体一致性,索尼并不是通过温度上限来限制过高的温度,而是类似笔记本电脑的功耗上限。CPU 功耗加上 GPU 功耗总体不会超过这个上限,在这堵功耗墙之下,CPU 和 GPU 的频率通过一个调节算法进行变动。
由此,每一台 PS5 无论是放在冰箱还是处于普通室温环境下,无论出厂时芯片体质是否有些微的偏差,都能有统一的性能表现。毕竟统一性能是游戏主机的一个大前提。
笔者举个简单的例子。这个核心就像一个跷跷板,CPU 和 GPU 各在一端。索尼人为给这两个端设定了各自的最高高度,无论两者怎么变,各自高度都不会超过这个最高高度。CPU 和 GPU 时上时下地变化,它们各自的最高高度的功耗就对应索尼公布的 3.5GHz 和 2.23GHz 的频率数据。
这种稳定总体功耗下内部功耗动态分配的技术是 AMD 为笔记本平台准备的 SmartShift(无独有偶,英伟达近期也宣布了其笔记本平台类似技术 Dynamic Boost)。比如某些时候 CPU 性能过剩,那就会把原本分配给 CPU 的电量资源转移给 GPU,让它能够获得更高的频率,反之亦然。
索尼表示用于处理这个电能分配任务的芯片集成在处理核心当中。这颗芯片的灵敏度极高,一丝一毫的能耗变化都能够立刻侦测并做出响应。毕竟对于 PS5 这个系统而言,CPU 和 GPU 在某时刻的功耗对于开发者是非常重要的数据。
为什么这么说呢?虽然 PS5 是一个整体稳定的系统,但其内部的动态性能和传统主机,以及对手机型 Xbox Series X 的固定性能都不同,这就需要游戏开发者针对这种动态性能采取与以往不同的优化策略。
塞尔尼说:“这里最有趣的地方就是对功耗的优化。如果你能修改代码让同样帧数表现发生在更低的功耗下,那么这就是一种成功的优化。”也就是说,开发者需要通过对功耗的优化来让性能变强,从而获得更理想的结果。功耗和频率的关系是非线性的,“通常情况下,比如降低 10% 的功耗只会让频率下滑几个百分点(而不是也跟着下降 10%)。”
既然系统频率在变,那么为什么索尼声称 CPU 或是 GPU 在绝大部分时间内能保持或者接近极限频率呢?塞尔尼对此的解释是加上了称为“闲置竞争”(race to idle)的现象。
他举了个例子,比如游戏运行在 30 帧的情况,平均下来每一帧画面有 33 毫秒的渲染时间,但 GPU 只用了 28 毫秒就完成了工作,那么剩余的 5 毫秒就是无事可干,处于干等垂直同步的状态,这就叫“闲置竞争”。他表示在这 5 毫秒也维持高频率是没有什么意义的,或许意味着实际游戏中这 5 毫秒 GPU 频率可能会下降。
但为了给 GPU 频率一个说法,于是把“闲置竞争”这个情况加上,也就成了“绝大多数时间维持在极限或者接近极限的频率”。CPU 也同样如此。
这种变频听起来还是比较复杂,会不会让游戏开发者优化起来很困难?塞尔尼表示团队的一个突破就是找出了一系列让 CPU 和 GPU 能量密度保持一致的频率,将这些频率转换为锁定的性能描述,放入开发套件当中。开发者根据这些频率数据着重优化,无需面对复杂的变动频率。
向下兼容在这种系统下大概是如何实现的呢?我们可以回顾一下 PS4 Pro 为了兼容 PS4 的设计思路 —— “蝴蝶架构”。把 PS4 的 CU 单元数量翻倍,频率略微提升,CPU 仍旧是八核 Jaguar,只是频率提升了一点。运行 PS4 游戏的时候只要关闭一半 CU 单元再略作调整即可。
PS5 的 GPU 也是类似处理,CU 单元数量与 PS4 Pro 一致。从此前的泄露数据来看,这颗 GPU 兼容在兼容时会根据 PS4 Pro 和 PS4 各自情况调整运行模式,使其接近原始运行环境,降低兼容难度。
不过这次 PS5 的 CPU 变化很大,采用了最新的 Zen 2 架构,可能会给兼容带来额外难度。“所有为 Jaguar 开发的游戏理论上在 Zen 2 下都能正常工作,但是指令执行时间(the timing of execution of instructions)基本不一样。我们与 AMD 定制了我们的 Zen 2 核心,为他们添加了不同运行模式,使其能接近 Jaguar 的执行时间。”
塞尔尼表示团队仍在研发向下兼容功能。另外,索尼曾表示兼容游戏支持强化,这个强化效果究竟如何还有待实机测试。
次世代索尼和微软都依据开发者的反馈选择了固态硬盘作为主存储介质,而且都各自做了自己的定制化设计。PS5 的 SSD 吞吐量达到了 5.5GB/s,已经超出了大部分固态硬盘的速度,这毫无疑问是非常值得骄傲的成绩。那么硬盘的高速除了给我们带来载入速度的提升,还给我们带来了什么呢?
PS5 的数据传输调动了很多部件协同运作,比如 I/O 处理器、凝聚引擎、DMA 控制器等等,机制比较复杂。不过索尼给开发者准备了底层和高层的访问能力供开发者自行选择。底层有一个新的 I/O API 能让开发者轻松使用它的极限速度,门槛低,很友好。
PS5 的文件索引不再是传统的“文件名+路径”这种方式,而是改成只基于 ID 的存储系统,让文件查找更加迅速。几毫秒的延迟就能够找到需要的文件并传输,这些发生在一帧的处理时间内,即便是最坏情况顶多下一帧也能完成。要是这放到机械硬盘里,这个过程会持续 250 毫秒之多。
塞尔尼举了个例子。比如一个敌人死亡时发出喊叫,即便将这个声音播放请求在此时置为首要任务,仍然很可能还是要花费 250 毫秒,那么产生的声音延迟会导致沉浸感下滑。类似场景下就需要迅速响应降低延迟。PS5 的 SSD 将显著改善这种问题。
声音是次世代的一个提升重点。索尼在 PS5 上耗费了大量心血和精力来提升声音维度的沉浸感。
主要的变化有两个方面,一个是 PS5 支持数百个 3D 音源,数百个空间音源支持自不必说,能更好地模拟现实生活中的环境音源。音源有了,那么声音又该如何模拟出从空间里的某个坐标位置传递至耳朵的效果呢?这就需要第二个变化点,使用 HRTF(Head Related Transfer Function,头部相关传递函数)。
HRTF 的相关技术涉及到的知识非常专业和广泛。我们只需要知道它是一个基于以人头为坐标原点的球坐标系、人的头部结构数据、声音频率等信息的一种函数,将虚拟空间中的音源所发出的声音近乎准确地分别传入左耳和右耳。
HRTF 的效果非常出色,但要达到最理想的效果需要针对使用者自身的头部数据进行定制。每个玩家都定制自己的 HRTF 显然不现实。索尼的做法是首发时提供五种不同的 HRTF 效果,由玩家自己在这五种里选择最适合自己的那一个。
当然这只是目前的处理方式,塞尔尼表示这是一个开放性的研究话题,也许未来玩家可以给索尼发送自己的头部数据,比如照片、视频等,来给自己做个定制化。
对以上这两点进行处理的,就是一个名为“Tempest”的引擎。与 PS4 通过 CPU 来处理音频的方式不同,Tempest 是一枚单独的芯片,基于 AMD GPU 的一个 CU (计算单元)改造而来,可以认为是 GPU 的变种。由于其本身原理非常类似一个连续的整体,所以内部无任何缓存就可实现设计目标。
团队之所以采用 GPU 类型的芯片是因为 GPU 本身就是专为多线程任务打造。“GPU 能处理成百上千个 Wavefront(AMD GPU 的线程组被称为 Wavefront ),Tempest 支持两个 Wavefront。一个是针对 3D 音频和其他系统设计功能,一个是针对游戏。”
不过由于更多的声音和相关数据要处理,Tempest 占用带宽会超过 20GB/s。这不是一个小数字,所以需要开发者注意 Tempest 带宽占用情况,倘若过高会产生不良影响。
此外 Tempest 与另一个名为 Ambisonics 的音频技术兼容,后者如今支持 PS4 和 PSVR。塞尔尼表示二者可以混合使用,比如一个非常重要的声音可以采用 Tempest 进行处理,而主要的场景环境音可以用 Ambisonics 处理,将二者的优势都最大化来达到满意的效果。
不过 3D 音频在首发时暂时不支持所有种类的音频设备,索尼选择的是按照设备保有量先后进行适配。标准耳机是首发时即支持的设备,目前索尼正在处理电视扬声器的优化,5.1 和 7.1 音响系统需要等电视扬声器优化完毕后再着手进行处理。略有遗憾的是,对于后两者索尼没有给出大致的支持时间。
虽然很多具体技术细节公布了,但 PS5 硬件本身仍留有很多疑问。毕竟目前我们所知道的仅有一个在老版本开发机上跑的《蜘蛛侠》载入时间 Demo 、两篇《连线》杂志的采访、一个 Logo 、未完全展示的手柄,和一个技术向 PPT。
也就是说我们到现在连 PS5 一个实际渲染游戏像素点的信息我们都不知道。当年 PS4 首次公开时就带来了《杀戮地带 暗影坠落》的 Demo 演示,世代更迭的提升一目了然,实机游戏永远是最好的说服力。另外还有一点,索尼称 PS5 的 GPU 为 RDNA 2 架构,但近期该架构公布的一些关键技术,比如可变速率着色,PS5 没出现在支持名单上,这不免让人有些疑问。主机外观和散热系统也同样让人非常好奇。
所有疑问,只能等待索尼进一步的信息公布了。
微信内搜索VGTIME2015,关注我们
长按图片下载App,获取更多精彩内容