近几年显卡市场可以说并没有太多令人沸腾的动作,主要原因就在于目前仍是主流的RX 7000、RTX 40系列显卡虽尚能饭否,但在其他硬件迭代速度加快的当下,对比一看难免落入了“牛夫人”的境地,虽然AMD陆续更新了FSR3.5,相继推出多款GRE系列显卡,但老架构的提升潜力毕竟还是有限的,所以玩家们对新架构显卡的呼声也越来越大。
如今,铺垫已久的RDNA4架构到来,对玩家们来说可谓是久旱逢甘霖。当然,这并非玩家们的苦苦等待,AMD的这波节奏更像是一场“双向奔赴”,在发布时间上极尽压榨,终于一改往年晚于NVIDIA的的发布节奏,这次非常“巧合”的与竞品撞在了一起,结合RX 9000系列显卡的新命名规范,这股火药味,一触即发。
这里已经默认各位看官们了解了RX 9000系列的命名规则,简单来说则是彼之60则我之60,你发60Ti则我有60 XT,所以RDNA4先锋RX 9070、RX 9070 XT的对标竞品就非常明显。
但命名的对标不代表价格也要牢牢对标,AMD依旧保持了贯之以来的超高性价比,RTX 5070在我们撰稿时还未发布暂不可知,但首发价6299元的RTX 5070Ti摆在4999元的RX 9070 XT面前可谓毫无竞争力,那么唯一能打败RX 9070 XT的,或许只有看官们津津乐道的性能差距了,相信大家都想知道5070Ti能否接住这一招?
RDNA4——新架构全面发力
要了解这两块显卡,那么势必要先了解RDNA4架构对比此前有何升级,继RDNA架构面世以来,AMD也将其作为稳定迭代更新的核心之一,就好比CPU中的Zen架构,同样的,在工艺制程节点上RDNA4也是顺应时代,采用了目前最为先进的4nm节点,在高频、每瓦性能比上又将迎来巨大的提升。
除工艺外,核心架构部分RDNA4也迎来巨大更新,其一,计算单元(CU)上,AMD在单位规模上做了“乘法”,相较上代而言每CU总共四个双矢量引擎、两个标量引擎、四个AI单元及四个调度器,除此之外就是光追、纹理、IO、缓存这类常规组件,如果说此前的显卡都是靠单元数量暴力堆砌带来提升,那么RDNA4则更看重每单元的计算能力,减少调度带来的额外损耗,直接提升了效率。
在光线追踪上,RDNA4架构将其升级到了第三代,具体来说第三代光追单元包含一个光线加速器、一个光线转换引擎、两个光线交叉引擎、一个遍历堆栈管理单元,在吞吐量上相比上一代提升一倍,在我们实测后可以负责任地说,这一代光追单元将成为AMD光追能力逆转NVIDIA的开端,具体我们实测评论。
在AI方面,RDNA4主要在两个大方向上做出升级,一是兼容性,如新增FP8精度的计算格式支持,进一步扩宽AI负载的适配,第二则是性能,在FP16精度下性能提升翻倍,而在INT8精度下性能提升更是达到四倍,在硬件水准下RDNA4可以说遥遥领先,目前AMD优化的重点则是大力扩宽自家的AI生态,将RDNA4的AI能力发挥到极致。
如果说单元、光追、AI方面在性能以及广度方面带来巨大提升,那么媒体引擎的升级在我们看来更偏向使用,H.264 低延迟编码质量提升 25%且针对 FFMPEG、OBS 和 Handbrake 进行了优化,直接的好处便是游戏直播、转码时的延迟更低,效率更高,这对不少游戏玩家而言极为有用,此外传统的HEVC 编码质量提升11%,在720p 编码时性能提升高达30%,对视频工作而言受益匪浅,此外,在日常使用中也可实现VCN 低功耗视频播放(AV1和VP9性能提升50%),最为直接的好处便是观看流媒体内容(B站、网剧)更加节能。
所以在架构方面,一图得以总结,即更强的光栅化效率、光线追踪性能的飞跃、广泛且加深的AI支持、极富针对性的多媒体性能提升,可以说RDNA4架构带来的演化惊喜十足。
FSR4——玩家AI利器
当然不可忽视的是,在软件层面AMD也随RDNA4、RX 9000一同宣布了FSR技术的下一代——FSR4,在原有基础上,AMD另辟蹊径,引入了可升级的API框架,简而言之,此前需要游戏厂商们不断跟进而更新的FSR,现在可以通过API直接更新,降低游戏厂商们的开发难度,也能让玩家们第一时间用上一整套由FSR4带来的游戏提升。
除了可升级的API框架之外,超分辨率这次也迎来了重大升级,与以往采用分析处理模型不同,此次FSR4直接用上了混合学习模型,对分辨率的细化不像此前那样“暴力”,而是由带有选择的、有理解认知能力的AI模型针对不同物品、场景而优化,从而带来更精美、更精细、性能更强的超级分辨率体验。
目前FSR4功能将随RX 9000系列一同发布,而适配FSR4的游戏将在发布时达到30多款,且主要围绕玩家多、声量大的3A大作进行,并且AMD承诺在年内将FSR4的游戏覆盖范围扩充至75个以上,争取在“游戏黑科技”方面紧跟时代步伐。
简单聊完RDNA4架构以及FSR4技术,想必看官们对此次的新显卡已经抱有极大的期待,此次发布的RX 9070和RX 9070 XT作为中高端显卡,是玩家们的首选价位段,当然也有不少玩家更期待如RX 9080、RX 9090这类旗舰显卡,也有不少入门玩家会选择RX 9060或者RX 9060XT这样的性价比选择,这里我们也结合坊间传闻简单列了一张表,各位可以参考一下。
RX 9070/RX 9070 XT——新卡首秀
说回显卡本身,RX 9070 XT我们拿到的是来自技嘉的小雕,全称AORUS Radeon™ RX 9070 XT ELITE 16G,RX 9070则同样是来自技嘉的魔鹰,全称Radeon™ RX 9070 GAMING OC 16G,两款显卡均有极其浓厚的技嘉特色,外观在A卡中属于TOP级别。
在用料上,RX 9070魔鹰采用三风扇布局,背板有多边形通孔加强气流通过效率,全覆盖铜板直接覆盖GPU核心、显存、供电等主要发热件,实测在开放式游戏工况下满载核心温度仅55℃。同时配有双BIOS切换、RGB等功能。
而RX 9070 XT小雕在魔鹰基础上加大了整卡面积,外观设计迎合自家小雕系列语言,背板通孔更具设计感,炫彩光轮、大面积RGB分布,俨然一块精致且极具“肌肉感”的性能尖货。
此外,RX 9070魔鹰正面还附加有RGB切换滑块,玩家可自定义透光形式,提升些许DIY乐趣。
RX 9070 XT小雕正面则使用了大胆的锥形凹陷,辅以菱形羽翼点缀,线条感极为凌厉,营造出小雕翱翔的急速感。
游戏测试——剑锋直指,4K平权
简单讲完两块显卡的外观设计,直接进入实测,此次测试搭配的处理器采用锐龙5 9600X,虽说这颗处理器不算顶级,但极大的出货量以及极富性价比的特点,让其成为游戏玩家的主流之选,但为了避免处理器对游戏造成的影响,我们先行对比一下两块显卡的上一代以及竞品的基准成绩。
细心观察可以看到,在基于4K(Time Spy Extreme、Fire Strike Ultra)、2K(Time Spy、Fire Strike Extreme)分辨率的测试子项中,RX 9070 XT均能超过直接竞品5070Ti,2K以上的纯光栅成绩领先平均8.39%,要知道5070Ti虽然同样是16GB显存,但其升级到GDDR7后吞吐带宽提升,但饶是如此也未能胜过核心能力更强的RX 9070 XT。
代际对比来看,全项目RX 9070 XT相比上一代RX 7900 XT有着11.86%的提升,要知道RX 9070 XT仅有64组CU,这可比RX 7900 XT更少一些,可见RDNA4架构对游戏的提升非常巨大,这让我们也更期待更高阶的显卡表现。
4K分辨率游戏测试,统一采用最高画质预设,可以看到单论游戏帧数,RX 9070 XT可以完美胜任4K分辨率游戏,这意味着AMD顺利地将4K游戏的门槛拉低到了4999元,这在此前是完全不敢想象的。
对比竞品,RX 9070 XT的平均领先幅度为4.94%,看似差距不大,但结合售价来看。5070Ti可谓是毫无性价比可言,在多出一千多元的情况下仍旧被RX 9070 XT以绝对性能鞭策,AMD的性价比仍旧恐怖。
当然,我们也同步测试了2K及1080p游戏的表现,同样是最高画质预设,可以看到RX 9070 XT仍旧保持了轻微的领先幅度,整体领先在1.31%。
1080p分辨率下,整体的平均帧数领先幅度来到1.82%,看似领先不大,但在一些支持较好的游戏中,RX 9070 XT还是保留了两位数帧数的领先,要知道在1080p下,主要的瓶颈在处理器之上,换用9800X3D后差距只会更大!
由于媒体送测样品在首发前就已拿到,受限FSR4首发支持游戏的限制,对于FSR4的测试只能以“管中窥豹”的方式举一反三了,我们选取了《漫威争锋》进行测试,该游戏作为最早支持FSR4技术的游戏,在我们实测中即便是开启性能档,画质与原生相比几乎没有变化,相反,由于有了能理解画面的大模型加入,能够明显地看到开启FSR4后画面清晰度有了明显的上涨,对于同一个木质栏杆,顺利识别后加强与背景的区别,同时保持画面的氛围,观感反而有所提升,并且帧数的提升可是实打实的。
对于各挡位,我们也做了详细的测试,其中还加入了AMD驱动中的HYPE-RX全套功能一同参与测试,可以看到,同画质下开启HYPR-RX能够带来非常明显的提升,甚至在配合FSR4后,RX 9070甚至能在FSR4加持下超过同设置RX 9070 XT的原生帧·数,并且在原生帧仅有58fps的情况下,开启性能档FSR4以及HYPE-RX后能够直接跃升至191fps,性能直接提升229%,并且如此恐怖的帧数下观感反而更加优秀,现下只能期待AMD能够将FSR4推送更多的游戏!
AI——开箱即用的极速DeepSeek
时下Deepseek-R1大语言模型的爆火也算是再次引爆了新一轮的AI浪潮,全民部署Deepseek-R1的当下,我们也顺手看看两块新显卡能否如发布会所言,对AI带来巨大加持。
当然,AMD用于加速AI负载的ROCm在几个月前推出了Windows版本驱动,玩家只需在官网下载对应版本的HIP SDK安装即可,安装之后对于可用的AI负载能够最大程度压榨显卡的性能。
简单使用LMStudio 0.39版本进行测试,加载Q4精度量化的DeepSeek-R1 14B蒸馏版模型,对于16GB显存以及DeepSeek-R1各版本而言,14B参数量可以全量加载至显存,最大化看出RX 9070的AI性能。
可以看到生成600左右的字元数量下,生成速度来到51.35token/s,如果你对这个速度没有概念,作为对比的是目前各大云厂商API服务速度一般仅有不到10token/s,而简单地写一篇散文,加上思考过程仅需要12秒即可完成,速度极为夸张。
而RX 9070 XT在运行相同模型的情况下,运行速度为51.41token/s,与RX 9070相比一致,猜测是显存带宽成为制约生成速度的瓶颈,导致两块显卡生成速度一致,但饶是如此,也直接证明了AMD显卡如今面对AI也能轻松面对,甚至性能出乎意料的强。
但要实际说起来,14B参数量对于一些需要极强逻辑推理、需要庞大知识储备的话题来说还是少了些智商,于是我们也顺手测试了明显会溢出显存的32B参数量模型。
可以看到,RX 9070 XT的16GB显存对于如此庞大参量,显存已经不够用了,而需要借助内存来载入,由此带来的内存与显存间交换数据所带来的损耗已然不可忽略,生成速度仅有6.74token/s,速度大致与AI云厂商提供的API相当,仍然可用。
但对于时下的AI,不得不提的是,在Deepseek API服务成本下降的现在,普通群众运行本地Deepseek就不合时宜了,而真正有隐私需求的用户,则往往选择显存量大管饱的W系列工作站显卡自组多卡平台,端侧大语言模型的应用在此后还将以本地RAG+云服务为主,当然,作为游戏玩家,我们更愿意看到RDNA4将AI能力应用在服务游戏之上,显然目前的RX 9070以及RX 9070 XT在硬件上已经做好了准备。
总结:
所以总结一番,在游戏方面,RX 9070 XT相比上代RX 7900 XT提升11.86%,RX 9070相比RX 7900 GRE提升28.87%,横向对比竞品,RX 9070 XT相比RTX 5070Ti在4K下领先4.94%,在2K以及1080p下也能有一定领先。FSR4方面,通过《漫威争锋》的测试,在画质不变甚至观感提升的情况下,开启性能档相比原生最大可提升2.89倍!AI方面,在AMD的不断布局之下,A卡的AI能力可做到开箱即用,运行Deepseek-R1生成速度可达到50token/s以上。
但如果只看性能对比,可能玩家们会觉得似乎RX 9070 XT领先RTX 5070Ti并不明显,但要知道RX 9070 XT首发售价为4999元,而RTX 5070Ti首发售价需要6299元,1300元的差价不可忽视!另外,我们将游戏性能(从1080P到4K)与价格因素综合考虑,可以看到RX 9070 XT对RTX 5070 Ti的优势则为21%-25%,这无疑更加说明了,AMD真的是将玩家放在首位!
在4K显卡中,RX 9070 XT可称为性价比之王,而RX 9070在相同显存大小下甚至仅需4499元即可畅玩4K!是主流玩家升级4K的不二之选!
目前,AMD Radeon 9070系列已登录国内电商平台,点击下方链接直达活动页面https://pro.jd.com/mall/active/d2wNF3E89uvaUwHSeuu7MQoEGrB/index.html现在参与活动,可享受:晒单返100元(单卡)/200元(整机)京东E卡等活动,该活动有效期至3月15日,所以此刻,正是入手的好时机!