AMD的进步每瓦特性能玩家的利益

由:山姆Naffziger、高级副总裁、公司的家伙,和产品技术架构师,AMD
2022年12月5日上午8点等
运动: AMD数字影响
人玩视频游戏

身临其境的需求,现实的游戏经历不断的突破技术,推动改进支持功能,如可变利率阴影,射线追踪,和先进的升级技术。这些改进的经验需要不断持续进步的性能改进硅设计和架构,进而推动更高的功耗没有削减从摩尔定律或其他方法。

具体来说,高端显卡的力量迅速推高,超出400瓦。同时,功耗正迅速成为 主要问题 玩家,不仅是全球能源价格飞涨,但更高的权力意味着用户必须应对不断增加的散热和声音系统需要更大的冷却造成的解决方案。

硅的基础设计,抬高性能通过附加功能和更高的频率可以增加电力用户与性能。但与深思熟虑的和创新的工程和细化,我们可以更好的性能没有极高的功率预算,保持总体成本,热,和噪音低,同时仍然提供突破的经验和业绩。

前阵子在AMD,我们从头开始重新思考和改变了我们的核心架构,并在这一过程中,我们做了几个大的赌注来提高设计和能源效率。这些赌注现在偿还以有意义的方式在所有生产线的形式领导每瓦特性能,更安静,更轻的系统,可能会降低能源费用,较小的物理足迹。例如,现在AMD 导致效率 在超级计算机领域有四个五大最有效的超级计算机。

领导每瓦特性能游戏
AMD继续优先考虑最有效和强大的硅设计主要表现在图形和游戏。

最后的三代AMD Radeon™显卡看到了难以置信的每瓦特性能的改善。介绍了2019年,当AMD RDNA™架构与7 nm-based Radeon™RX 5000系列gpu, AMD之前交付50%每瓦特性能改进政府通讯架构。举个例子,这相当于50%更高的帧率在同一权力部门2[1]

2020年,当AMD RDNA™2架构被释放权力Radeon™RX 6000系列显卡,我们交付65%每瓦特性能比Radeon™RX 5000系列显卡在同一个7纳米技术[2]在建筑和硅设计创新。这把Radeon™RX 6000系列在一个高度竞争的每瓦特性能在堆栈位置,再一次显示AMD的承诺,强大而有效的计算。 

每瓦特性能的重要性
什么最好的每瓦特性能对玩家来说意味着什么?除了产生更少的热量和消耗更少的功率提供高性能长期时间之后,可以有一个操作成本节约效益也同样消耗很少的能量性能降低的电费和碳足迹。

建筑能效设计是我们的DNA
作为唯一一家发展中高性能cpu和gpu今天,AMD唯一能够利用知识在我们中心工程团队在我们的产品组合和利用最好的IP。例如,AMD的成功后Ryzen™桌面和移动处理器,提供令人难以置信的性能和效率,工程团队合作应用关键知识从我们的“禅”CPU发展到我们的Radeon图形架构RDNA™2一个极其有效的GPU的体系结构。 

我们把一些“禅”CPU微架构方法和设计方法在我们图形管道,简化的物理组成使更高频率可能死亡。例如,我们利用密集的CPU实现 L3的记忆AMD无穷缓存™、高密度、低功耗缓存,使游戏常用数据负载更便利,大大增加带宽,同时减少电力所需的内存和减少延迟[3]

进一步完善和改进AMD RDNA™2图形架构和提供更大的效率和性能,团队实现其他几个关键变化,包括:

  • 优化开关 ——改善架构的基本设计,确保每个通道切换,每个时钟切换性能有直接贡献,从而消除浪费活动,多余的路由优化图形管线。
  • 高频设计 ——优化设计高时钟速度,推动AMD RDNA™2频率超出AMD RDNA™高达30%,这使得GPU运行在一个较低的电压,以确保新的架构可以保持相同的时钟速度较低的权力[4]
  • 智能电源管理 ——在GPU实现智能电源管理,确定最好的机会来开发更高频率,所以只有当它直接提高了性能,然后可以减少,从而消除多余的能量使用。

接下来是什么?
展望未来,我们将继续推动与 更高效的游戏AMD RDNA™3 架构。作为第一个AMD图形架构利用5 nm过程和先进chiplet包装技术,AMD RDNA™3提供50%每瓦特性能优于AMD RDNA™2体系结构[5] ——真正带来顶级游戏性能在酷玩家,安静,以及节能设计。

导致这种节能设计,AMD RDNA™3改进AMD RDNA™2自适应电源管理技术来设置workload-specific操作点,确保每个组件的GPU只使用它需要为获得最佳性能。新的架构还引入了新一代的AMD无穷缓存™,预计提供即使人口密度较高,因该缓存减少图形记忆的电力需求,帮助水泥AMD RDNA™3和Radeon™图形作为一个真正的领导者效率。

我们兴奋的改进使与AMD RDNA™3和它的前辈一样,我们相信更有从我们的体系结构和先进的工艺技术,提供无与伦比的性能/瓦特在堆栈我们继续推动更好的游戏。

脚注

AMD不负责第三方网站的内容并且不表示支持。GD-5

[1]RDNA提供平均1.54 x的性能/瓦特/ GCN游戏,部门2。 测试由AMD性能实验室5/23/19,使用部门2 @ 25 x14超设置。系统配置:g Z390 AORUS精英,英特尔酷睿i7 - 9700 k的CPU、16 gb DDR4,赢得10个专业。基于使用最新的驱动程序的性能可能会有所不同。笔记本电脑制造商可能不同配置,产生不同的结果。rx - 325

[2] 测试由AMD性能实验室10/21/20,测量个体FPS分数和计算平均FPS得分在以下标题:刺客信条奥德赛(DX11,超低),战场上V (DX12,超低)边境3 (DX12,超低),控制(DX12、高),死亡滞留(DX12超),部门2 (DX12,超低),2020年F1 (DX12,超低)、5 (DX11,超低)相距甚远,战争机器5 (DX12,超低),杀手2 (DX12,超低)地平线零黎明(DX12,超低),地铁《出埃及记》(DX12,超低),生化危机3 (DX12,超低),《古墓丽影》的阴影(DX12、最高),奇怪的旅(DX12,超低),全面战争三国(DX11,超低),巫师3 (DX11,超没有HairWorks) 4 k。测试系统配置了一个核心19 - 9900 k的CPU, Radeon (TM) RX 6900 XT GPU AMD Radeon (TM)显卡驱动27.20.12031.1000,32 gb的内存,并赢得10与类似配置系统Radeon (TM) RX 5700 XT GPU和AMD Radeon 26.20.13001.9005 (TM)图形驱动程序。每瓦特性能计算除以每个GPU的TBP乘以平均FPS分数在所有标题。 笔记本电脑制造商可能不同配置,产生不同的结果。 性能可能有所不同。rx - 554。

[3] 测量计算由AMD工程,与128 MB AMD Radeon RX 6000系列显卡缓存和256位GDDR6无穷。测量4 k游戏平均AMD无穷缓存命中率58%最高游戏头衔,乘以理论峰值带宽从64 b AMD无穷 织物通道连接缓存的图形引擎提高到1.94 GHz的频率。rx - 535。

[4] 基于2020年10月AMD工程内部的3 d Mark11 graphics-engine-only平均功耗建模与频率的Radeon RX 5700 XT和Radeon RX 6900 XT gpu,除以数量的计算单元(40和80分别)。rx - 536

[5]https://www.amd.com/en/technologies/rdna