索尼系统架构师mark cerny今日公开了playstation 5的规格,深入介绍了新的系统架构。外媒digital foundry提前观看了这次演讲并与mark cerny进行了更深入的交谈,并了解到了设计背后的理念。
下面这段约53分钟的演讲原本这些内容是应该在gdc游戏开发者大会上发表的,不过由于疫情原因而导致本次活动取消了。在这段演讲中mark cerny主要介绍了ps5的固态硬盘、gpu、向下兼容ps4游戏、3d音频的特性,基本都是技术方面的内容,感兴趣的朋友可以看看。
ps5的硬件规格
playstation 5使用了amd的zen 2 cpu技术,包含8个物理核心和16线程,这些都是以前公布过的信息。现在我们知道了它们的时钟速度——ps5的cpu可以提供最高3.5ghz的频率。mark cerny将这个频率描述为“上限”,他表示这是通常情况下的速度,但在某些条件下它的运行速度可能会更慢。
索尼的定制版amd rdna 2 gpu具有36个运算单元(cu),运行频率上限为2.23ghz,可有效提供 10.28tflops 的峰值计算性能。虽然2.23 ghz是极限,但也是通常的速度,它可能会根据所需的工作负载而降低频率。ps5使用了一个boost clock。rdna 2运算单元的晶体管密度比ps4的运算单元高62%,这意味着就晶体管数量而言,ps5的36个运算单元阵列相当于58个ps4的运算单元。 而且这些新的运算单元运行的频率是以前的两倍。
以下是ps5的关键参数:
·cpu:8x zen 2 cores at 3.5ghz (可变频率)
·gpu:10.28 tflops, 36 cus at 2.23ghz (可变频率)
·内存:16gb gddr6/256-bit
·内存带宽:448gb/s
·存储:定制的 825gb 固态硬盘
·io吞吐量:5.5gb/s (raw), typical 8-9gb/s (compressed)
·存储介质:4k uhd blu-ray drive
ps5和xbox series x的硬件参数对比:
ps5的boost功能
认清ps5的可变频率是一件重要的事,它被称为“boost”,但它与手机或pc的cpu/gpu类似的技术不同,在手机或pc中,峰值性能和散热空间直接相关,因此在更高的温度环境下游戏帧率可能会降低,有时会变得非常低。这与家用主机的期望相矛盾,因为主机平台期望所有的机器都能提供完全相同的性能。因此,ps5没有使用这种方式来提高时钟频率。据索尼称,无论环境温度如何,所有ps5主机在任何环境下均会以相同的性能水平处理相同的工作负载。
那么在这种情况下boost是如何工作的?简而言之,ps5的性能预算与散热装置的散热极限有关。mark cerny说:“这是一个完全不同的例子,我们不是以恒定的频率运行和让性能根据工作负载而变化,而是以基本上恒定的性能运行并让频率根据工作负载而变化。”
一个内部监视器会分析cpu和gpu上的工作负载并调整频率以匹配。cerny在演讲中解释:“我们不是看硅芯片的实际温度,而是看gpu和cpu所执行的活动,并在此基础上设置频率——这使一切都具有确定性和可重复性。在这个过程中,我们还使用了amd的smartshift技术,并将任何未使用的性能从cpu发送到gpu,这样它就可以挤出更多的像素了。”
这一设计决策与微软的xbox series x完全不同,这可能意味着开发人员将需要注意可能影响时钟和降低性能的潜在功耗峰值。但对于索尼而言,这意味着ps5可以达到的gpu频率要远比我们预期的高,这些时钟也高于pc领域现有amd部件中的时钟。这也意味着它可以从36个可用的rdna 2计算单元中提取更多性能。
mark cerny不希望与过去、现在或将来的任何硬件进行比较,而是提出了一种有趣的假设方案—— 一个36个运算单元的图形核心以1ghz运行,与一个48个运算单元其中部分以750mhz运行。两者均提供了4.6tf的计算性能,但cerny说游戏体验将会有所不同。他解释说:“性能明显不同,因为'teraflops'被定义为alu的计算能力。这只是gpu的一部分,还有很多其它的单元——当gpu频率更高时,这些其它单元都运行得更快。频率如果提高了33%,光栅化的速度会快33%,命令缓冲区的处理速度会大大提高,l1和l2缓存也会有高得多的带宽,以此类推。唯一的缺点是系统内存在周期方面相差33%,但其带来的好处远不止于此。正如我的一个朋友所说,水涨船高。此外,与完全使用48个cu(运算单元)相比,完全并行使用36个cu要容易得多,当三角形较小时,要用有用的工作来填充所有这些cu要困难得多。”
索尼的想法是这样的:较小的gpu可以成为更灵活、更敏捷的gpu,其推论是ps5的图形核心应该能够提供比你所预期的更高的性能,而tflops的数字并不能准确地包含gpu的所有能力。开发人员在soc (system on chip) 的性能限制下工作,他们的工作负载会影响运行中的频率,但影响时钟速度的是这些因素,而不是环境温度。cerny承认上一代硬件的散热解决方案可能不是最佳选择,尽管cpu和gpu的时钟频率很高,但以固定的性能预算下运行的概念能够使散热的概念更易于处理。
cerny在演讲中说:“从某种意义上讲,这将成为一个更简单的问题,因为不再有未知数,无需猜测最坏情况下的游戏可能具有的功耗。至于散热解决方案的细节,我们今后在设备拆解的时候再谈。我想你会对工程团队的想法而感到满意。”
playstation 5图形核心
当处理器达到其功率极限并且组件降频时会发生什么?mark cerny在演讲中表示cpu和gpu不一定总是分别在3.5ghz和2.23ghz上运行。他说:“当最坏情况的出现时,它将以较低的时钟速度运行,但是不会降低太多,将性能降低10%只需要降低几个百分点的频率,所以我认为任何降频都是相当小的。综合考虑各方面因素,向变频方式的转变将为playstation玩家带来显著的收益。”
在功能层面,cerny揭示了一些功能,这些功能建议与其他即将面世的基于rdna 2技术的amd和amd衍生产品持平。一个被称为“几何引擎”的新模块为开发人员提供了对三角形和其他图元的无与伦比的控制,并且很容易优化几何剔除。功能扩展到“原始着色器”的创建,这听起来与nvidia turing和即将推出的rdna 2 gpu中的网格着色器非常相似。
尽管cerny并未提及机器学习支持或可变速率着色等技术,但ps5确实通过其intersection engine提供了硬件加速的光线跟踪,cerny称其“基于与amd即将推出的pc gpu相同的策略”。外界曾猜测会有一个外部模块,但事实并非如此——像下一代navi和xbox series x一样,光线追踪硬件是内置在着色器中并完全集成的。与rdna实现类似,ps5将可以实现我们在pc领域看到的相同光追——反射、环境光遮挡、阴影和全局照明都是很好的选择。
cerny说:“我们能走多远呢?我开始变得相当乐观了。我已经看到过一款ps5游戏,它可以在复杂的动画场景中成功地使用基于光线跟踪的反射,而且成本也很低。”
ssd如何实现次世代梦想
soc芯片的性质及其功能很重要,然而,从演讲中可以清楚地看出mark cerny有着非常不同的优先级,这里有两个非常具体的组件:ssd(固态硬盘)和一个称为“tempest引擎”的出色的3d音频硬件。
索尼在固态存储领域投入了双倍下注,每隔几年mark cerny都会环游世界与数十位开发人员和发行商会面,而集成ssd是次世代的首要需求。索尼让ps5的存储性能比ps4快了两个数量级,2gb的数据可以在四分之一秒内加载,这意味着从理论上讲ps5的整个16gb内存容量可以在两秒钟内被填满 。cerny说:“作为游戏创造者,我们从试图分散玩家快速传送时要花费多久时间的注意力(比如蜘蛛侠坐地铁),到现在这么快以至于我们甚至不得不放慢这种过渡。”
要使性能提高两个数量级,就需要大量定制硬件才能将ssd无缝连接到主处理器。定制闪存通过12通道接口与ssd模块结合,可以提供所需的5.5gb/s的性能以及总共825gb的存储空间。这听起来可能是一个奇怪的数字,因为消费者的ssd通常是512gb、1tb或更大,但索尼的解决方案是专有的,825gb是12通道接口的最佳选择,而且还有其他优势。简而言之,索尼拥有更多的自由来调整其设计:“我们可以研究可用的nand闪存部件,然后设计出性价比最高的产品。有人可能认为打造一个m.2硬盘没有这种自由,如果它不是那些标准尺寸之一,将很难营销和销售。”
控制器本身通过四通道pci express 4.0互连连接到主处理器,并包含了许多旨在消除ssd瓶颈的定制硬件模块。该系统具有六个优先级,这意味着开发人员可以根据游戏的需求来考虑数据的优先级。该控制器支持行业标准zlib的硬件解压缩,也支持rad game tools的新kraken格式,该格式可额外提供10%的压缩效率。那么底线呢?5.5gb的带宽相当于每秒输入系统的有效带宽为8g或9g。cerny透露:“顺便说一句,就性能而言,定制的解压缩器相当于9个我们的zen 2核心,这就是用传统cpu对kraken流进行解压缩的过程。”
一个专用的dma控制器(在性能上相当于一个或两个zen 2核心)将数据定向到所需的位置,而两个专用的定制处理器则处理i/o和内存映射。最重要的是,一致性引擎像管家一样运作。cerny在演讲中解释说:“一致性在很多地方都出现了,可能最大的一致性问题是gpu缓存中的陈旧数据。在读取ssd时刷新所有gpu缓存是没有吸引力的选择,它可能会损害gpu性能,因此我们采用了一种更温和的处理方式,在这里,一致性引擎会将覆盖的地址范围通知给gpu,而数十个gpu缓存中的定制清理程序会精确地逐出这些地址范围。”
所有这些都交付给开发人员而无需他们做任何事情。定制硅甚至可以解决解压问题, cerny解释说:“你只需指出要从原始的未压缩文件中读取哪些数据,以及将数据放置在什么位置,然后整个加载过程就会在你不可见的情况下以非常快的速度进行。”
△ps5内置的固态硬盘与ps4机械硬盘的速度对比
索尼如何应对扩展存储
自mark cerny首次揭示ssd的特性以来,人们就一直在问扩展存储。当你已经填满了分配给你的825gb存储空间时会发生什么?
首先,ps5支持向下兼容——你可以通过从常规的外部存储设备运行老游戏来节省空间,它不会像从内部ssd启动那么快,但这将为需要的次世代游戏腾出空间。一旦达到了限制,我们觉得游戏可以备份到标准的硬盘上,但是有一个选项可以增加ssd的存储空间——nvme pc硬盘可以在ps5上使用。唯一的问题是pc技术远远落后于ps5,更新的基于pcie 4.0的硬盘需要一些时间才能上市,它的带宽要求符合索尼的规格。
然后,索尼还需要对其进行验证以确保它们可以正常工作。 ps5将拥有一个nvme插槽,但硬盘的兼容性至关重要,这不只是带宽问题。 ps5的规格为开发人员提供了六个优先级,而nvme规格只有两个。
mark cerny说:“我们肯定可以只将两个优先级连接到一个硬盘上,但是我们的定制i/o单元必须仲裁额外的优先级——而不是m.2硬盘的闪存控制器——因此m.2硬盘需要一点额外的速度来处理由不同方法引起的问题。这个商用硬盘还需要在物理上适应我们在ps5中为m.2硬盘所打造的托架。与内置硬盘不同,不幸的是m.2硬盘的高度没有标准,并且某些m.2硬盘具有巨大的散热器,其中一些甚至拥有自己的风扇。”
虽然内部ssd解决方案是专有的并且有着非标准的容量,但这不会影响兼容的m.2硬盘的存储容量,如果你购买了1tb或2tb的硬盘,你就会拥有这么多存储空间。cerny说:“ m.2硬盘将拥有自己的闪存控制器,并具有与其nand闪存晶粒自己的(不可见的)内部接口。我们不知道或不需要知道该内部接口的详细信息,或者通过接口连接的nand闪存的大小和类型。重要的是m.2硬盘的外部接口(例如第四代pcie的四个通道,这样它就可以连接到我们的闪存控制器)以及它可以通过该接口支持的读取带宽。”
简单来说,扩展存储是可能的,你不需要索尼的专用硬盘来获得你想要的额外空间。但是至少在短期内的建议很简单:如果你打算在playstation 5上使用nvme硬盘,请不要购买没有经过索尼认证的nvme硬盘。还要记住,超高带宽的pcie 4.0 nvme硬盘可能非常昂贵,至少在短期内,毕竟这是尖端技术。但是很显然,随着次世代的发展前景将显着改善,而价格则会随着时间的推移而明显下降。
△ps5将会向下兼容ps4游戏。在ps5上市时,ps4上最常被游玩的前100款热门游戏基本上都将立即支持向下兼容。
通过tempest engine实现前所未有的3d音频保真度
在与mark cerny交谈时,他感叹自己在与开发商和发行商的定期访问中几乎见不到音频工程师,而为了提供次世代的音频体验,索尼自己不得不采取行动了。音频本身在当前世代的服务水平一直很差,通常只能得到jaguar核心的一小部分来提供7.1环绕声,远远低于ps3时代所享受的音频。实际上,cerny指出psvr是当代环绕声的标准持有者,因为它具有可支持“ 50个相当不错的音源”的定制音频单元。而ps5的新tempest engine支持数百个,并且质量更高。
在当今的游戏中下雨是一种简单的声音。借助tempest engine,playstation 5旨在通过模拟各个雨滴撞击到你周围地面的声音,营造出真正处于淋浴中间的感觉。这更多的是能够精确跟踪物体的位置,而实现这一目标的科学技术是令人惊讶的,因为这必须考虑到你的耳朵的形状,甚至是头部的大小和形状。
为了精确模拟定位,索尼需要生成一个表,这称为“与头部相关的传递函数”(head-related transfer function - hrtf)。可以通过处理该表中的音景来模拟如何感知音频,可以说这是一项计算量巨大的任务。 tempest engine实际上是经过重新设计的amd gpu计算单元,剥离了其缓存并仅依靠dma传输,就像ps3 spu(协处理单元)一样。反过来说,这为充分利用运算单元的矢量单位打开了大门。
mark cerny在演讲中透露:“最终我们得到的单元,其simd功率和带宽与ps4中所有八个jaguar核心的总和大致相同。如果我们使用与psvr相同的算法,那么对于5000个声源来说都足够了——但是当然我们要使用更复杂的算法,而不需要像这么多的声音。”
简而言之,“tempest engine”开启了游戏音频真正的革新之门,尽管这个系统在达到最大潜力方面还面临着挑战,但有一件事你不需要担心,那就是购买高端音频硬件来享受这种体验。在短期内简单的解决方案是使用耳机:两个耳朵和两个扬声器就是你所需要的全部,剩下的交给tempest引擎来处理。展望未来,索尼对电视扬声器和soundbar的虚拟环绕声带来的出色效果感到乐观,多扬声器系统也将获得支持。
然而环绕立体声音响系统的野心是如此之大,以至于我们可能在一段时间内看不到它的潜力得到充分发挥。通过hrtf系统处理音频的挑战在于每个人的头和耳朵都是不同的,索尼为大约一百个人设计了hrtf并提供了发售时的五个预设方案。配置工具将确保为你选择最佳的方案。但是很显然,能够输入你自己的hrtf才能呈现出最终的体验,而实现这一目标正在研究当中。
mark cerny说:“也许你可以向我们发送你的耳朵照片,然后我们将使用神经网络来选择库中最接近的hrtf。也许你会向我们发送你的耳朵和头部的视频,我们将会制作出3d模型然后合成hrtf。也许你会玩一个音频游戏来调整hrtf,我们会巧妙地在你玩游戏时进行更改,并在hrtf上给你最高的分数,这意味着它最适合你。这是我们在未来几年内将共同经历的旅程。最终,我们致力于使每个人都能体验到更高层次的现实主义。”
以上就是本次索尼透露给大家的ps5的一些特性,当然,我们距离ps5完全解开谜底还有一段距离。