在桌面CPU市场,过去几乎长达十年的时间,Intel都处于无敌寂寞的状态,AMD则属于打不死小强,一直则处于小众市场状态。2017年3月,AMD锐龙登场,就像一剂强力催化剂,改变了一切,开启了逆袭Intel之路。
凭借不世的Zen架构,以及稳健的产品和市场策略,AMD不断冲击各个领域。从桌面到移动笔记本,从企业到数据中心,从发烧到主流再到入门级,AMD都博得了满堂彩,Intel也终于惊醒过来,开始认真对待这个蛰伏许久的对手。
今年AMD发布了第二代锐龙处理器,不仅12nm工艺制程领先Intel,顶级第二代锐龙ThreadRipper 2990WX“二代线程撕裂者”更是逆袭Intel酷睿i9,成为目前最强的桌面处理器,今天我们就来通过AMD锐龙ThreadRipper 2990WX评测,带大家全面了解这款AMD史上最牛CPU。
如果说锐龙让AMD重新在主流和高端市场站稳了脚跟,Threadripper处理器则把AMD重新带到了发烧领域,这里是最新最强、最尖端技术的领地,没有两把刷子是进不来的。
AMD一度错失发烧领域N多年,Intel因此显得惰性十足,至尊平台虽然也在一代又一代地更新,但更多的是按部就班的小幅升级,无论工艺架构还是规格性能都波澜不惊,价格更是无比傲娇。
比如说在一年半之前,发烧友们能买到的最强的处理器还是酷睿i7-6950X,只有10个核心20个线程,价格却高达1723美元(国内一万三左右),而且从未降价。
2017年8月,也就是整整一年前,Threadripper处理器诞生,谁都不会想到它居然轻松挑落了Intel的霸主地位(而且它还是个计划外的产物呢)。
第一代旗舰ThreadRipper 1950X,上来就有16个核心32个线程,再加上四通道DDR4内存、64条PCI-E 3.0等激进规格,表现绝对是吓人级别的,比如多线程性能比i7-6950X一下子就提高了一半。
更关键的是价格,它定在了999美元(国内首发8499元现在已经只要5999元),只有i7-6950X的一半多点,从性价比上讲更是高出2.5倍,因此极具杀伤力。
Intel当然不甘心被压一头,随即拿出18核心36线程反击,并首次寄出了雪藏多年的酷睿i9序列,性能上保住了自己的王者地位。
但是这颗i9-7980XE的价格高达1999美元(国内首发15999元如今仍要14999元),显得高不可攀。
AMD这种激进的产品和定价策略十分有效,也获得了普遍认可。从京东商城的评论看,1950X、7980XE的销量比大概是十比一,对于AMD来说这无疑是一个十分漂亮的战绩。
一度有传闻称,Intel打算放弃至尊发烧平台。虽然被Intel否认,但也不难看出,Intel如今在顶级领域内确实有点扛不住。
第一代锐龙Threadripper处理器已经打了所有人一个措手不及,第二代又让所有人震惊了一把,恐怕谁都没想到AMD如此激进,几乎就是直接把数据中心的EPYC霄龙给完全搬了过来,桌面平台首次出现了堪称恐怖的32核心64线程。
每次打开Windows系统的任务管理器,看到64个框框,那种震撼,真的妙不可言哪。
AMD突然来这么一招,不仅仅让Intel现在的18核心36线程无地自容,也几乎断绝了Intel的后路,因为在目前架构下,Intel最多也就28核心56线程,无论如何是追不上了。
当然,Intel可以搞单芯片封装两个Die,组成56核心112线程,但无论功耗发热还是价格,必然都会失控。
根据泄露的路线图,Intel确实打算在桌面上祭出28核心56线程,并为此开辟新的A系列,有望在今年底推出,但接口又要变,主板又要换,AMD这边则是一个TR4包打天下(主流也就一个AM4)。
但最关键的还是价格,AMD直接把32核心64线程压到了1799美元(国内13999元),实在是狠得没法形容,这比18核心36线程的i9-7980XE还要便宜一大截。
28核心56线程,Intel怎么也不会卖得低于两万五,基本等于两颗AMD 32核心56线程……
二、技术解析:各种玩法享受32核心
1、架构与工艺
第二代AMD锐龙Threadripper处理器和主流市场上的第二代锐龙一样,都应用了升级后的Zen+架构,以及升级后的GlobalFoundries 12nm(12LP)制造工艺。
在此前对锐龙7 2700X、锐龙5 2600X的首发评测中,我们已经对Zen+架构和GF 12nm做了较为详细的介绍,此处不再赘述。
简单地说,Zen+架构的IPC性能提升了大约3%(可以理解为同频性能提升3%),一二三级缓存分别降低最多13%、34%、16%,内存延迟降低最多11%,内存频率提高到2933MHz。
按照AMD的数据,2990X的一二三级缓存延迟分别为1ns、2.9ns、9.03ns,2950X分别为0.92ns、2.76ns、8.64ns。二者内存延迟为近端64ns、混合86ns、远端105ns。
GF 12nm则是此前14nm的优化版,晶体管性能提升10-15%,对于第二代Threadripper来说最高加速频率提升200MHz,任何频率下核心电压降低80-120mV。
2、更强动态加速
升级后的SenseMI智能技术也得到完整继承,比如第二代精准频率提升(Pricision Boost 2),加速幅度精细到25MHz,更关键的是升级了算法,会在撞到散热或者供电限制之前加速到尽可能高的频率,或者达成预设频率。
直白地说,在多核心多线程运行的时候,第二代Threadripper仍能保持尽可能高的频率,而且线程数量增加与频率降低基本呈线性关系,而不会像之前那样突然遭遇断崖式降频。
根据AMD提供的数据,2950X可以在单线程时加速到最高4.35GHz,之后随着线程增多,频率稳步下降,16线程时仍能保持在3.7GHz的高度,32线程跑满时也能有3.5-3.6GHz。
2990WX身上同样体现的十分明显,单双线程时能接近4.2GHz,32线程时可泡3.6GHz,即便是64线程全开也能稳定在3.4GHz。
其实很多时候,我们经常可以看到某款处理器标称的加速频率很高,但很难坚持很长时间,往往几十秒甚至几秒钟就会掉下来(所谓三秒真男人),而且随着线程数量的增多,加速也会十分困难。
而第二代Threadripper处理器在核心线程数量大增的同时,依然保持了强劲的多线程加速能力,不至于在多线程负载中频率跟不上而造成实际性能低下,这无疑是难能可贵的。
还有第二代自适应动态扩频技术(XFR2)。如果散热器更强大,或者运行温度更低,第二代Threadripper处理器同样可以获得额外的加速空间,而且和第二代精准频率提升一样,它也是在所有核心与线程上工作的。
根据AMD提供的数据,如果把2990WX在180W普通风冷散热器、32℃室温下的性能视为基准,换用新的Wraith Ripper散热器可以额外加速多达11%,室温降至20℃则可以提升13%,而如果换上水冷,则能平白获得16%的额外性能!
至于精准功耗控制、神经网络预测、智能数据预取三项技术,都没有任何变化。
4、游戏模式
2990WX是全球第一颗32核心64线程桌面处理器,其实并不适合打游戏,因为没有任何游戏需要这么多核心,而且游戏引擎开发之初一般也不会考虑如此之多的核心,所以用它跑游戏反而往往会出现兼容性和性能问题。
为此,AMD特别提供了游戏模式(Game Mode),可以在Ryzen Master工具中与创作者模式(Creator Mode)互相切换,打开后2990WX就会只使用8个或者16个核心,此时游戏性能反而会更高。
以上是AMD官方提供的2990WX正常模式、游戏模式的游戏性能对比,可以明显看到在多少游戏中,游戏模式都很有用,尤其是《GTA 5》、《杀出重围:人类分裂》、《全面战争:战锤2》、《占地1》。
AMD也表示,游戏对于多核心的支持也正在完善,去年16核心Threadripper处理器刚出来的时候,不少游戏都不正常,但现在已经几乎不存在这种问题,从上图也可以看出,16核心跑游戏偶有性能下降,但影响并不大。
后边的环节里我们会对游戏模式的具体原理、效果进行详细测试、分析。
5、内存模式
由于锐龙Threadripper处理器核心众多,而且内部分成多个Die,又支持四通道内存,所以在内存支持和应用方面AMD也做了特别设计,使用的时候需要分情况注意。
为了理解第二代Threadripper处理器的内存机制,先来看看结构拓扑图:
2950X还相对简单一些,内部两个Die,每个Die有8个物理核心,同时每个Die对外连接两个内存通道、32条PCI-E 3.0通道(分成两组),两个Die之间通过一条Inifinity Fabric总线互连,DDR4-1600内存的时候IO带宽就有大约50GB/s。
2990WX就比较复杂了,内部共有四个Die,各自还是8个物理核心,但依然只有两个Die分别负责对外连接两个内存通道、32条PCI-E 3.0通道,另外两个Die是没有的,AMD称之为Compute Die,也就是只负责计算。
同时,每两个Die之间都有一条Infinity Fabric,总计六条之多,这样可以保证两个Die之间的物理核心可以直接沟通,从而降低延迟。内存频率1600MHz的时候,每条互连总线带宽约为25GB/s,也就是2950X的一半。
为了提高内存性能,AMD设计了两种内存访问模式,其一称为分布模式(Distributed Mode),整个系统配置为一体化内存访问(UMA),内存访问需求在所有可用通道之间均匀分配,即便是应用在多线程下的表现难以预料也能确保内存性能的一致性。
这也是线程Threadripper平台的默认内存模式,也是Ryzen Master工具中创作者模式(Creator Mode)搭配的内存模式。
其二是本地模式(Local Mode),配置为非一体化内存访问(NUMA),它是2950X的独有模式,整个处理器分为两个节点(node),每个节点包含一个Die和两个内存通道。
操作系统会尽可能将进程和内存需求放在同一个节点内,不够了才会扩展到第二个节点,这能在线程不多时降低内存延迟,非常适合用来玩游戏,因此在Ryzen Master工具中,如果启用游戏模式(Game Mode),2950X就会切换到本地模式内存配置。
自从锐龙发布以来,AMD就在持续研究不同游戏对于处理器配置的敏感度,发现差异相当大,比如《古墓丽影崛起》、《守望先锋》、《奇点灰烬》等喜欢更多核心,《暗影魔多》、《地铁:最后微光》、《热血无赖》在高频率下表现更好,《战争机器终极版》、《辐射4》、《杀手:赦免》对内存延迟很敏感,《使命招魂:现代战争》、《孤岛惊魂4》、《星球大战:前线》则需要核心之间的低延迟。
AMD表示,在16核心上评估了超过75款游戏后发现,本地模式能带来平均约5%的性能提升,《杀手:赦免》最高可超过10%,而非游戏应用在分布模式上表现更佳,证明两种内存模式的设置和切换是有效的。
6、传统兼容模式
Ryzen Master中还提供了一种传统兼容模式(Legacy Compatibility Mode),打开之后2950X会只启用一个Die、8核心16线程、双通道内存,2990X则可以是两个Die、16核心32线程、四通道内存,也可以是一个Die、8核心16线程、双通道内存。
如果有游戏对于多Die、多核心多线程、多内存通道完全不兼容,这就轮到了传统兼容模式表现的时候了。
AMD测试了60多款游戏开关传统兼容模式的性能对比,发现平均会带来4%的性能提升,最好的四分之一游戏更是可以提升12%,主要有《文明6》、《使命召唤:现代战争》、《风暴英雄》、《全面战争:战锤2》、《DOTA2》、《孤岛惊魂5》、《幽灵行动:荒野》、《看门狗1/2》、《神偷》、《杀手:赦免》、《辐射4》、《CSGO》、《生化危机7》、《战锤40K:战争黎明3》。
7、PBO超频
AMD处理器全线开放手动超频,可以轻松获得更高性能,现在第二代Threadripper处理器又提供了一种新的超频模式“Precision Boost Overdrive”(PBO)。
它也可以理解为一种自动加速超频技术,但更多地取决于主板设计,包括处理器插座功耗承受能力、主板热设计电流、主板电气设计电流,这三者尽可能地提高来获取更多性能,官方号称可比默认状态额外带来16%的提升。
官方号称可比默认状态额外带来16%的提升。
PBO相比于手动超频,最大的好处是会保留空闲降频、精准加速能力,而不是固定在一个频率上,从而更加灵活。
但是注意,PBO也属于超频行为,由此造成的损坏将失去质保。
新闻热点
疑难解答