写在开头
就在月初,老黄在CES 2025上给大家带来了重磅新品——GeForce RTX 50系显卡,虽然比以往时候来得更晚一些,不过GeForce RTX 50系显卡一出场,每项都是王炸级别的升级!全新服务器级别的Blackwell架构加持,TSMC 4N工艺打造,还有DLSS 4、Reflex 2等诸多黑科技集于一身!各方面堪称极致,甚至突破功耗上限,为的就是给极客玩家带来更极致的体验。
听到这大家应该都已经垂涎若渴了吧,想要体验一下最新的GeForce RTX 50系显卡,特别是旗舰级的GeForce RTX 5090 D,它更是一众游戏爱好者的“梦中情人”。这次我们有幸在第一时间上手了iGame GeForce RTX 5090 D Advanced 32GB显卡。作为国内的显卡一哥, 七彩虹出品的“Advanced”系列是一直是笔者最在意最心水的一款,喜欢的不仅是它羁傲不驯的性能,更喜欢它标志性的“大红圈”的设计风格,单是颜值就让人百看不厌!下面就给大家带来这款显卡的全球首测!
规格介绍
开始前,照例讲讲新显卡的规格。GeForce RTX 50系显卡采用了此前NVIDIA在AI领域推出的Blackwell架构,以大卫·布莱克威尔命名,其是一名受人尊敬的数学家和统计学家,在博弈论和统计学领域留下了不可磨灭的贡献,NVIDIA用其名字命名这一架构反映了新平台的开创性和先进的计算能力。Blackwell可以说是NVIDIA近年来更新幅度最大的GPU架构了,相比起之前的架构来说,划时代的引入了神经网络着色器,力图为游戏开创先进、高效更有逼真的渲染方式,带给玩家全新的游戏体验。
相比前代Ada架构,Blackwell的升级聚焦于四大方向:分别是AI算力的爆发、光线追踪技术的革新、显存能效的提升以及划时代的神经网络渲染。
第五代Tensor核心
其中AI算力的爆发就不得不提到Blackwell架构上的第五代Tensor核心,新一代Tensor Core添加了对FP4浮点运算精度的支持。FP4是一种较低的量化方法,类似于文件压缩,可以减小模型推理过程中数据存储和计算量大小,提高计算效率,降低该过程对显存的要求。与大多数模型默认使用的FP16相比,FP4使用的显存不到其一半,并使GeForce RTX 50系列GPU的性能相比上一代提升高达2倍。
第四代RT核心
而光线追踪技术的革新则仰赖于第四代RT核心的加持,相较于第三代RT核心来说,Blackwell架构的第四代RT核心主要提升了检测光线、路径与三角形相交的效能,过往在检测时往往只能检测单个三角形,一旦场景复杂,检测能力不足就容易导致渲染出错等问题,而现在检测能够以簇集方式进行,检测效率更高。同时还有三角形簇集解压缩引擎加持,其新增了Linear-swept Spheres(LSS)功能,可以减少渲染毛发所需的几何图形数量,并使用球体代替三角形以获得更准确的毛发形状拟合,能够让显卡发挥更好的性能但只消耗较小的显存占用。
综合来看,Blackwell架构的光线追踪多边形相交效率是上一代Ada架构的2倍,是Turing架构的8倍,同时还可以节省25%的显存使用率。
第四代RT核心的改进主要是为实现更好的光追效果。其中有两项新技术能够受益,第一项是RTX Mega Geometry技术。随着光线追踪游戏场景的几何复杂性不断增加,游戏画面中几何图形的计算量也呈现出快速增长的趋势。而RTX Mega Geometry技术能够加速构建边界体积层次结构(BVH),使得在实时渲染中可以处理多达100倍的三角形数量。
该技术的出现,也使得开发者能够在游戏场景中使用更复杂的几何图形,而不会影响游戏帧率。过去需要一个个算BVH,现在RTX Mega Geometry能够智能地在GPU上批量更新三角形簇,减少了CPU的负担,既保证了性能,也兼顾了图像质量。相信随着这些技术的不断发展和应用,未来的游戏将能够呈现出更加逼真和细腻的视觉效果,同时保持高效的性能表现。
另外一个能够受益的技术则是Curve Primitive,方便光追在曲面中的应用,例如一位男士的头发可能需要多达400万个三角形,再加上光线追踪技术,画面所需要的运算负载极大。NVIDIA则通过第四代RT核心中的Linear- Swept Spheres(线性扫描球体)技术有效减少了渲染头发所需的几何体数量,以球形代替多边形,更贴合头发的形状,从而将内存占用量大幅缩减至三分之一,并进一步提升了实际帧数,让头发的渲染效果更加自然流畅。
GDDR7显存
第三点改变则是显存效率的提升,Blackwell架构中还首次加入了对GDDR7显存的支持,此前GDDR6显存的信号编码为NRZ/PAM2,而RTX 40系上的GDDR6X则是PAM4编码。最新的GDDR7显存,信号编码改成了PAM3,NRZ/PAM2每周期提供1位的数据传输,PAM4每周期提供2位的数据传输,而PAM3每两个周期的数据传输为3位。说人话就是,新的编码机制可以使杂讯失真比减小,信号品质更清晰,同时还能带來更高的显存运行频率以及更低的电压,根据NVIDIA的介绍,使用GDDR7显存后,数据传输速率可达GDDR6时的2倍,并且功耗接近GDDR6的一半,经典加量还减价。
神经网络着色器
接着我们再细说一下这一代架构最大变化,NVIDIA这次将Blackwell架构的SM单元直接称为神经网络着色器。相比较于之前的可编程着色、CUDA统一着色、通用计算着色来说,其最大的变化就是引入了AI,AI将会彻底改变GPU的着色方式。
在Blackwell架构中,NVIDIA 进一步拓展了神经网络渲染的范畴,引入了诸多创新元素,包括神经网络纹理压缩(Neural Textures)、神经网络材质(Neural Materials)、神经网络体积(Neural Volumes)、神经网络辐射场(Neural Radiance Fields)以及神经网络辐射缓存(Neural Radiance Cache)等,这些元素共同构成了神经网络渲染中神经网络着色的重要呈现方式。
这里举个例子让大家能够更简单的理解神经网络渲染,过去复杂的物品或大量异材质的贴图往往会占用相当大的内存空间,如果叠加光追的话,计算量将会更大。然而,得益于神经网络渲染技术中的神经网络材质功能,这一问题得到了显著改善。开发者可以先在离线渲染出物品的光照数据,然后再用这些数据训练一个小的AI模型,游戏运行时只要实时调用这个AI模型当场推理就好了,这样就能还原出想要的光照效果了,再配合神经网络纹理压缩技术,就能显著降低实际生成的材质数据量,从而在占用更少显示内存的同时,实现了细节更丰富的材质表现,达到了实时生成如电影般细腻素材的效果。
目前神经网络渲染技术已经得到了微软的大力支持,未来也将会加入到DirectX中,玩家能够体验到更真实的游戏世界。
而在硬件层面,由于神经网络渲染的加入,Blackwell架构的SM单元相较于RTX 40系的Ada架构还是有不小变化的,Ada架构内的SM内,SM单元会拆分成一半的CUDA专门用于处理FP 32(单精度浮点数),另一半则依需求动态调整去处理FP32和INT32(32位整数)。而在Blackwell架构上,SM单元则改成了CUDA核心可以完全依需求动态处理FP32和INT32的形式。
另外一个改进是,过往的着色工作往往只有SM单元的Shader在处理,而Blackwell架构上引入了神经网络渲染以后,使得Blackwell架构上的第五代Tensor核心也能共同分担着色工作,大大提高了着色效率。
这样改进的好处是,Blackwell架构能够进一步针对神经网络渲染工作进行排序,即把传统的着色工作分配给Shader,而需要动用神经网络渲染的工作负载则可以给到Tensor核心上,两种核心同时运用,效率最高可以提升2倍之多。并且得益于Tensor核心也加入了可编程渲染管线,现在开发者或API也能更好的调用Tensor核心,未来游戏内我们能见到的AI技术势必越来越多。
先进的AI管理处理器
此外,AI的应用也越来越多,不仅游戏中应用AI技术,现在连可编程渲染的过程里也引入了AI,因此如何去分配显卡内部多样化工作就成了一个问题。如过往显卡在开启DLSS玩游戏时,其中应用到的语言模型和游戏引擎需要同时与GPU的不同核心交互,生成游戏帧,但是往往很难做到每一帧都有一致的生成时间,亦或者是游戏AI对话的响应不够及时,这些情况都会造成游戏体验不友好。
而Blackwell架构为了解决这一问题,引入了AI管理处理器(AMP)。它能够实时调度资源,确保在神经网络渲染、帧生成和 AI 驱动的游戏交互中实现智能化的任务分配。这种设计不仅带来了更高效的性能输出,还让显卡在游戏渲染和 AI 运算之间实现了绝佳的平衡,确保帧的间隔均匀,对话类型的AI能够及时响应,玩家的游戏体验一致性能够比较好的保障。
GeForce RTX 5090 D规格
说了这么多,给大家看看Blackwell架构里最顶级核心GB202的结构图,完整核心拥有12个完整规格的GPC(图形处理集群)每个GPC内建了8个TPC(纹理处理集群)即整个GB202核心会有96个TPC,而每个TPC内又有2个SM单元(流式多处理器) ,因此完整的GB202核心内包含的 SM单元总数高达192个,非常夸张。
另外完整的GB202核心还有高达24576个CUDA核心,相比上代Ada架构的AD102核心的18432个CUDA核心,涨幅约为33%。同时在架构图中我们还可以看到在缓存方面,整个GB202核心拥有512-bit位宽、128MB的二级缓存,每个SM单元也单独配备了128 KB的缓存。
再看下方的GeForce RTX 5090 D的架构图,还是很容易看出其与完整GB202核心的差距的,其核心代号为GB202-250-A1,在架构上拥有10个完整的GPC以及1个非完整GPC,计算下来,就是GeForce RTX 5090 D上共有85个TPC,170个SM单元,21760个CUDA核心,规模相比完整核心少了约11.5%。另外二级缓存方面虽然没有给到完整的128MB,不过还是比上代RTX 4090的72MB要高多了,给到了96MB。
在工艺制程方面,新的GB202核心沿用了TSMC 4N 工艺。不过核心面积与晶体管数量倒是多了,其中GB202核心面积来到了750mm2,相比上代的608mm2大了23%,一会儿拆解部分你就知道有多大了。晶体管数量则是有原来的763亿增长到了922亿。不过功耗也由上代的450W一举跃升到了575W,名副其实的“核弹级”显卡。
除此之外,GeForce RTX 5090 D还配备了32GB GDDR7海量显存,显存位宽以及带宽再创新高。为玩家提供高分辨率下的极致帧率,同时也为AIGC用户提供了当下顶级的显存规格,高分辨率出图更加高效。
最后一个变化则是售价了,上代RTX 4090的售价为12999元,而全新的GeForce RTX 5090 D国行售价16499元起!具体上市时间则是1月30日,感兴趣的玩家不妨关注一下,下面我们就先一步给大家揭晓一下这张顶级显卡的性能。
外观赏析
在了解它的真正实力前,我们先一起看看这张显卡的构造。iGame GeForce RTX 5090 D Advanced 32GB显卡采用经典彩盒+绿底包装,包装正面有显卡的渲染图,5090 D的型号标志以及七彩虹iGame Advanced标识,左下角还特别标注了显卡采用了32GB GDDR7规格的显存。
包装盒的背部就更丰富了,ADVANCED的标识异常吸睛。包装盒上还展示了这款显卡的设计与RTX 50系列显卡的部分黑科技。方便玩家对即将上手的显卡有个基本的了解。
拆开包装以后,内部依旧奢华。犹如开箱奢侈品一般,非常有仪式感。
包装盒内到处充满珍珠泡棉,保护能力拉满。
细数内部的配件,可以说是应有尽有,除了显卡本体之外,iGame还为玩家准备了定制的金属显卡支架、螺丝刀、RGB同步线、4×8Pin转16Pin电源转换线以及说明书等。
再看我们的主角iGame GeForce RTX 5090 D Advanced显卡,相较于之前的Advanced系列,这一代可以说是有了大刀阔斧的改变。显卡整体采用黑铁色作为配色基底,导风罩处则创新的采用了黑透磨砂材质,玩家可透过外甲看见若隐若现的显卡内构,非常有科幻感。
另外,这一代iGame Advanced系列的外观设计还融合了NVIDIA RTX 50 FE的设计语言,导风罩的造型犹如一个无限标志∞。同时,导风罩的正面是稍微向内凹的,看过CES上老黄演示的玩家应该不陌生,这也是FE显卡的风格。
不过与FE显卡不同的是,iGame GeForce RTX 5090 D Advanced加入了经典红色风扇环这个点睛之笔,官方称其为“引力之环”,与上面提到的“莫比乌斯带(∞)”设计相得益彰,赋予这张显卡高贵且神秘的气质。
而散热风扇配置上,则是延续了“两大一小”的经典配置。两侧的是107mm,中间的则是101mm,每把散热风扇都为9片扇叶,官方称其为“风镰”扇叶。同时细心的玩家应该也注意到了,左右两侧的风扇转向与中间的不同,这样设计可以,使空气形成旋涡聚风吸入提升风压,增加进风量。
中间“引力之环”除了有经典的红色金属环外,内部还镶嵌了透明的灯带,上机点亮以后可以实现五彩斑斓的效果,并且还可以配合iGame自家的iGame Center软件对灯效进行自定义设计。
当iGame GeForce RTX 5090 D Advanced亮灯以后,那个感觉真的不一样,双环RGB灯组配合磨砂黑的半透导风罩,光影若隐若现,如同星辰之光在夜空中缓缓扩散。
iGame Center除了能够控制显卡的RGB灯光之外,还有许多实用的功能,例如显卡超频、风扇控制、游戏帧数监测等等,感兴趣的玩家可以前往七彩虹官网下载软件。
我们继续看外观,来到显卡背部,银灰色的金属背板设计更显个性,科幻工业风再度拉满。无论是右侧的进气开口,背板上的凹凸纹理还是左侧的 GEFORCE RTX 文字,官方都通过斜切 + 斜视效果,营造出一种充满力量的速度感。
当然整个背板上最显眼的肯定是中间固定的核心了,可以看到这一代RTX 5090 D的核心真的足够大,一会儿拆解部分我们再一睹它的真容!
显卡背板的尾部是镂空的散热设计,不过iGame GeForce RTX 5090 D Advanced没有想一般显卡一样将散热鳍片裸露在外,而是加了一层半透明的盖板,这其实是设计师的小心思——隐藏式LOGO设计,通过斜线的高低起伏,在特定角度能观测到iGame LOGO。
视线来到显卡四周,顶部除了有一整排的镂空散热鳍片外,还有不少设计小细节。例如我们能看见每一颗螺丝位都刻有铭文,iGame还给外壳做了下沉设计,配合半透明的导风罩,犹如蓄势待发的星际舰船一般。
显卡顶部的左右两侧分别是GEFORCE RTX与Advanced的Logo标识,这也是该系列经典的设计了。
侧边同样延续了黑铁色的设计,让整张显卡从里到外都彰显出一种低调而奢华的气质。另外,侧边还加上了iGame的铭牌,与顶部的Advanced铭牌非常相称,无论你是横装还是竖装,都能一眼看出iGame的显卡。
回过头看看显卡的供电接口部分,与上代RTX 40系列一样,iGame GeForce RTX 5090 D Advanced采用的是12VHPWR接口,也就是我们常说的16Pin,单口可以提供最高600W的供电能力。
如果你是从比较早的硬件升级至RTX 50系,那也不用担心。iGame也为这部分玩家准备了4×8Pin转16Pin的供电转接线,体验顶级性能完全不成问题。
参与供电的除了有12VHPWR接口外,还有显卡底部的PCIe金手指,并且这一代的PCIe接口还升级成为了5.0速率,这也是首次在RTX 50系显卡上应用,能够带来更高的传输速率,并且金手指的形状和上一代的显卡有些微的变化。
显卡I/O接口部分,视频输出接口还是常规的3个DP加1个HDMI的配置,不过规格上有了升级,iGame GeForce RTX 5090 D Advanced采用的是DP 2.1b与HDMI 2.1b规格。
理论上,这一代显卡的视频输出接口可以轻松实现4K 480Hz和8K 240Hz超高分辨率与超高刷新率的需求。
接口的附近还有显卡超频模式开关,按下开关即可体验更激进的显卡性能。熟悉iGame的玩家应该都很熟悉了,这个开关集成了双BIOS模式,给玩家多一个BIOS备用选择多重保障,满足不同玩家的需求。
最后我们再来看看显卡的“三围”数据,根据我们的测量,iGame GeForce RTX 5090 D Advanced的尺寸为368.2*159.7*69.3mm(含挡片),基本上是3.5槽的厚度。重量方面也是来到了2.6kg,所以准备入手的玩家记得看看自己的机箱尺寸够不够~
显卡拆解
看完了显卡的外观,我们再看看iGame GeForce RTX 5090 D Advanced的内部构造。拆解这款显卡还是非常简单的。卸下背板上的螺丝即可取下金属背板,同时也能看到上面我们提到的半透明镂空盖板,显卡横装时能够依稀看见iGame的Logo。
接着取下I/O与金属外框的固定螺丝后,就能将PCB与厚重的散热系统分离。不过拆解的时候要小心,切勿大力出奇迹,避免风扇连接线与RGB连接线断裂。
再看PCB的设计,PCB采用的是类公版的方案,越肩设计,比一般的显卡都要再高一些,不过PCB上的接口、供电、核心、显存,以及辅助供电位置都相当的合理且规正,有大厂出品的质感。
PCB的背板相比正面更为简洁,元器件更少,不过各种元器件密密麻麻的排布,俨然一座小型城市一般,完全是科技工艺品!
PCB的正面塞的是GB202-250-A1核心,这也是iGame GeForce RTX 5090 D Advanced的大脑,其由TSMC 4nm 4N NVIDIA Custom Process工艺打造,内部有21760个CUDA核心,相比RTX 4090的16384个CUDA核心,提升了约30%左右,妥妥的地表最强消费级显卡。
核心的四周则是16颗显存芯片,原以为RTX 4090上的12颗已经非常多了,现在直接堆满16颗GDDR7显存,单颗2GB,共32GB显存,豪华程度不言而喻。
细看显存芯片,可以看到其来自三星,丝印编号为K4VAF325ZC-SC28。根据官方数据,iGame GeForce RTX 5090 D Advanced的显存位宽为512-bit,显存带宽为1792 GB/s,显存速率则可以达到28Gbps,非常夸张。
显卡供电方面,iGame GeForce RTX 5090 D Advanced采用16+7+6供电设计,共计29相。作为对比RTX 4090 FE为20+3相设计,可以说RTX 50系在供电配置上非常激进了。
豪华的堆料自然要豪华的散热加持才能发挥全部战力,接下来看看iGame GeForce RTX 5090 D Advanced上全新的旋涡(Vortex)散热装置,没错火神系列的同款!旋涡(Vortex)散热装置可以分为三个部分,分别是散热风扇、散热器以及散热金属中框。
散热器最显眼的就是右侧大面积的真空腔均热板,散热效能不容小觑。除此之外,均热板的四周,显存、电感、MOS管接触的地方也都用上了高系数的导热垫辅助散热。
散热器内部用的则是真空冰片技术,超扁平的密闭腔体内充冷凝液,吸收热量后通过相变原理散发热量,真空密闭腔体与热管及鳍片合为整体,散热效能突飞猛进。如此规格的散热系统前所未见,配合金属背板上的镂空设计,压这颗GB-202核心绰绰有余。
接着如果你想取下鳍片散热器,则需要拆除外部的金属中框,其由全铝骨架构成。轻巧而坚固的铝合金,不仅能够提升显卡整体的刚性与稳定性,同时得益于金属良好的导热性,它还能辅助显卡散热,属于是一举两得了。
整个散热器为左右两段式设计,由导流型鳍片覆盖,该设计最早用于高单价的服务器中,拥有更大的间隙,利于风流进入,加速内部气流循环,如今用于显卡上,为玩家提供更优的导热效果。
在散热鳍片之间还暗藏玄机,里面有7根8mm热管与2根6mm热管,每根热管都贯穿整个散热器,并且直触上方的均热板,同时得益于回流焊接工艺加持,使其与鳍片严丝合缝,犹如一体,保证了高效导热。
主动散热部分则是外观部分给大家介绍过的三把“风镰”散热风扇,全新升级的扇叶配合双滚珠轴承设计,绝对是散热系统的中流砥柱,既保证了风量的充足又兼顾了风扇的寿命。
最后给大家看看拆解全家福,综合来看,iGame GeForce RTX 5090 D Advanced无论是在外观设计,还是做工用料方面都十分舍得下本,不少用料都是旗舰甚至超旗舰的配置,确实不负RTX 5090 D顶级显卡之名。
测试平台介绍
开始性能测试前介绍一下本次的测试平台, CPU使用的是旗舰级的Inteli9-14900KS处理器,主板同样为旗舰级的Z790 MAX主板。内存为G.Skill的幻锋戟Z5 RGB DDR5,在Z790 MAX主板上能轻松达成DDR5-7200 C36的成绩,并且我们这次选用的是24G×2的套条,确保这张显卡能够释放全部性能。
显示器部分我们则采用的是微星MPG 322URX QD-OLED,其配置非常出色,采用三星新一代QD-OLED面板,支持4K分辨率240Hz刷新率和0.03ms(GTG) 响应时间;同时它还通过了VESA ClearMR 13000认证和DisplayHDR 400认证,能够确保影像色彩鲜明并减少动态模糊。
不过,这款显示器最出众的点在于其配备了满血版DP 2.1接口,配合iGame GeForce RTX 5090 D Advanced,可轻松实现4K@240Hz的卓越显示效果,搭配 10bit 色深和广色域支持,带来极致流畅丝滑的视觉效果,无论你是日常办公,还是激进的电竞游玩,它都能以艳丽的 HDR 色彩或酣畅的帧数给到你极具冲击力的视觉表现。
完整测试平台配置如下:
理论性能测试
开始测试前,照例还是要“认识”一下这张显卡。由于GPU-Z还没适配最新的显卡,因此部分信息还不能显示,不过从目前的信息中可以看到iGame GeForce RTX 5090 D Advanced 32GB的基准频率为2017MHz,Boost频率为2407MHz。其他方面,这张显卡为PCIe 5.0接口,妥妥的战未来设计。
理论性能部分,看3DMark,在FireStrike系列测试中,iGame GeForce RTX 5090 D Advanced表现亮眼,4K分辨率下领先RTX 4090 D约50%,而在以DX12为代表的Time Spy测试中,同样是4K分辨率,新显卡得分26173,对比RTX 4090显卡强约40%,而对比RTX 4090 D则可以扩大至50%左右的性能领先。
光追项目上,iGame RTX 5090 D Advanced也是一骑绝尘,凭借35496的成绩遥遥领先于RTX 4090,性能领先幅度同样高达48%。而在最新的Speed Way测试里,更是突破了51%的性能提升,不得不说这代RTX 50系显卡还是有点东西的。
DLSS 4专项测试
看完了理论性能部分的测试,接着我们再来看看本次RTX 50系显卡最“顶”的升级,DLSS 3在RTX 40系显卡上引入了帧生成技术,能够依靠AI在两帧之间生成一帧AI帧,从而实现帧数的翻倍,用过的玩家都说好!不过由于每生成一个新的帧都需要光流加速器和 AI 模型参与,因此生成多帧的开销相当高昂,而过高的性能开销会带来瓶颈,导致帧率提升受限。
而这次DLSS 4全新升级,引入了多帧生成技术,它可以利用 AI 为每个渲染帧额外生成多达3帧!相比传统渲染的方式,能够最多实现8倍的性能提升。并且每次渲染额外帧只需要帧生成AI模型执行一次,就能输出三帧画面,因此无论是对性能、显存的开销还是延迟都比之前要好了许多。
另外,由于多帧生成技术,输出的帧多了,要给每一帧都安排一个合理的间隔刷新才能让观感更好。因此NVIDIA还引入了专属的Flip Metering来代替CPU Pacing,它将帧节奏逻辑转移到显示引擎,让GPU能够更精确地管理显示时间,尽可能的将每一帧画面的生成时间保持一致,从而提高整体游戏视觉的流畅感。不过由于Flip Metering是硬件级的控制器,因此DLSS 4的多帧生成目前只有RTX 50系显卡支持。
同时DLSS 4 还引入了图形行业首个 Transformer 模型实时应用。熟悉AI的应该对它很熟系了,它在AI生成领域已经应用多年了。基于Transformer架构的 DLSS 超分辨率和光线重建模型,相比之前DLSS使用的卷积神经网络(CNN)模型来说,具备2倍的参数量和4倍的计算量。在游戏场景中,能够提供更高的稳定性、更少的拖影、更高的细节和更强的抗锯齿能力,使画面更加清晰、流畅和逼真。
不过虽然DLSS 4的多帧生成功能是RTX 50系显卡的独占功能,但新的Transformer模型将会逐步下放至DLSS 3、DLSS 2等,将适用于所有GeForce RTX显卡。并且根据NVIDIA的说法,超过75款游戏和应用将在GeForce RTX 50系列开售时支持DLSS 4的全新DLSS多帧生成功能,包括《赛博朋克2077》《战神:诸神黄昏》《心灵杀手2》《霍格沃兹之遗》等,《黑神话:悟空》也将于今年晚些时候升级支持 DLSS4的多帧生成。随着时间的推移,支持DLSS 4的游戏和应用数量将不断增加。
简单介绍完,我们再看看DLSS 4的理论表现如何,还是经典的3DMark测试。不得不说iGame GeForce RTX 5090 D Advanced搭配上DLSS 4有如神助,帧数再度实现了飞跃!其中2K分辨率下,开关前后性能差距足足有4倍,4K分辨率就更夸张了,开关帧数差距得有6倍,即便是对比DLSS 3的话,帧数也能提升72%,接近翻倍的体验了。最离谱的还要属8K,要知道RTX 40时代,8K游戏最多也是90 FPS左右的水准,而现在RTX 50系可以做到234 FPS,看来显示器厂商得加把劲才行了,早日让玩家体验到8K高刷游戏才行。
接着我们看看DLSS 4在实际游戏中的表现,第一款游戏是《霍格沃兹之遗》,支持DLSS 4技术以后可以在设置看到帧生成部分多了一些选择,其中×2则是原本DLSS 3的帧生成,而×4则是RTX 50系独有的多帧生成功能。
4K分辨率画质光追均设置最高的情况下,iGame GeForce RTX 5090 D Advanced不开任何超分技术,平均帧为126 FPS,不得不说这游戏优化还不错。如果开启DLSS 3性能档,此时帧数已经能够做到311 FPS了,畅玩完全没有问题。不过开启DLSS 4以后,你会发现帧数来到了恐怖的519 FPS,对比原生4K时,性能提升了3倍以上。并且1%Low也更高了,游戏稳定性更有保障。
第二款游戏我们测试的是《星球大战》,一样你能在设置中看到其帧生成功能已经支持×4的选项,也就是DLSS 4多帧生成功能。
DLSS 4在这款游戏中的作用就非常明显了,在4K原生分辨率下,强如RTX 5090 D也没能征服,平均帧仅有34 FPS,延迟也是高得吓人。此时开启DLSS 4性能档以后,游戏平均帧就好像打了鸡血一样,257 FPS的表现与原生4K完全就是天壤之别,从无法玩到高刷电竞,效果惊人,换算成性能的话,整体提升了得有7倍左右。
下一款游戏则是有“显卡杀手”之称的《赛博朋克2077》,有一说一,《赛博朋克2077》的设置页面就更丰富,除了能够设置DLSS 4的多帧生成外,还可以切换DLSS 4的另一个特性——Transfomer Mode,据说能够让画质更清晰,后续的文章中我们也会详细介绍这一技术。
下面我们先看DLSS 4的实际游戏提升,“显卡杀手”确实不一般,在最高画质+路径追踪的情况下,RTX 5090 D只能跑33 FPS,几乎不可玩。开启DLSS 3以后,游戏帧数可以满足4K@144Hz的需求了,如果你像我们使用的是支持4K@240Hz的微星MPG 322URX QD-OLED,那DLSS 4绝对有用!开启以后,iGame GeForce RTX 5090 D Advanced能够做到接近300 FPS,对比原生分辨率,性能足足提升了7.75倍。1%Low就更离谱了,几乎与DLSS 3下的平均帧相当。
如果你想玩的游戏还不支持DLSS 4,那也不用担心,NVIDIA App还提供DLSS 4 Override功能,说人话就是能够让游戏强开DLSS 4,这里我们以《漫威争锋》为例,在NVIDIA App中简单设置,就能将帧生成调至“4×”,一键实现多帧生成。
实测这种方式开启多帧生成功能确实有用,iGame GeForce RTX 5090 D Advanced在4K全高设置下,帧数为472 FPS,对比DLSS 3的262 FPS,提升了一倍左右,对比原生分辨率的话,性能提升则是3倍以上。同时延迟表现也非常出色,原生分辨率下,其延迟为35ms,而开启DLSS 4以后,延迟能够降低至21ms,游戏会更加跟手,体感更佳。
总的来说,DLSS 4多帧生成功能的出现,毫无疑问让玩家的游戏体验又上了一个台阶。对比上代RTX 40系的DLSS 3帧生成功能,再度实现了帧数的飞跃。同样的画质设置,RTX 5090 D的表现遥遥领先于RTX 4090,实测在上面提到的四款游戏中,开启DLSS 4的iGame GeForce RTX 5090 D Advanced最高性能可以做到RTX 4090的1.6倍!
另外,值得一提的是,与DLSS 4一起到来的还有全新的NVIDIA Reflex 2技术。延迟一直是电竞中绕不开的话题,玩家的每个动作都会经过复杂的计算,再在屏幕上渲染,这其中的每一步都会增加延迟。虽然延迟往往只有几十毫秒,但是你却能明显的感觉到游戏的不流畅、卡顿。
为了尽可能的降低延迟所带来的不良游戏体验,NVIDIA发布了NVIDIA Reflex技术,它可以使GPU和CPU同步,确保最佳响应速度和低系统延迟。目前NVIDIA Reflex已集成到超过100款游戏中,可以将PC延迟降低50%。
而GeForce RTX 50系显卡再度升级,带来了NVIDIA Reflex 2技术。它结合了Reflex低延迟模式与Frame Warp技术。它可以把最新的鼠标输入指令同步给渲染帧,及时更新渲染的游戏帧并在渲染帧被发送到显示器之前获取最新的鼠标信息,通过刷新渲染的游戏帧以进一步减少延迟,将PC延迟进一步降低多达75%。
另外,Frame Warp的加入,能够进一步将延迟降低。当一个帧被GPU渲染时,CPU会根据最新鼠标或手柄输入计算工作流中下一帧的视角位置。Frame Warp从CPU采样新的视角位置,然后将GPU刚才渲染的帧扭转到最新的视角位置。在渲染帧被发送到显示器之前,在尽可能最新的时间进行扭转操作,确保屏幕上反映最新鼠标输入。
而当Frame Warp转移游戏像素时,图像中可能会产生缝隙撕裂、镜头位置的变化会让游戏场景中显示新的部分。NVIDIA则开发了一种优化了延迟的预测渲染算法,该算法使用来自先前帧的视角、颜色和深度数据,对这些撕裂空白的像素进行准确的图像修复。玩家可以通过更新的视角看到没有撕裂的渲染帧,并降低了改变游戏内视角位置而产生的延迟。说人话就是现在NVIDIA Reflex 2还可以根据上一帧的信息去脑补一些空白的像素,有种无中生有但你又看不出来的感觉。
首发支持NVIDIA Reflex 2技术的游戏是《THE FINALS》以及《无畏契约》,后续我们也会第一时间带给大家该技术的详细评测。
游戏性能测试
了解完DLSS 4的“逆天”表现以后,我们再关注一下常规的游戏性能表现,还是老样子,先跑3DMark的DLSS 3性能测试。iGame GeForce RTX 5090 D Advanced在2K分辨率下,对比RTX 4090 D,性能提升了48%,对比RTX 4090的话,性能提升也有40%以上。4K分辨率下,开启DLSS 3以后则分别领先RTX 4090 D和RTX 4090约50%和43%。
当然理论性能终归是纸上谈兵,还得进游戏里实际测试一下才知道iGame GeForce RTX 5090 D Advanced的实力。这里我们选取了13款游戏进行测试,包含光追及光栅性能方面的测试,而游戏画质方面均全部选择最高画质,光追设定部分,如有则采用最高。
实测4K分辨率下,iGame GeForce RTX 5090 D Advanced应对起来犹如砍瓜切菜一般简单,即便是全高设置下,依旧能够流畅运行各种3A大作,在我们实测的多款游戏中,即便是压力最大的《黑神话:悟空》,也能实现接近4K@144Hz的游戏水准。具体到性能上,iGame GeForce RTX 5090 D Advanced整体比RTX 4090强约30%以上,如果对比RTX 4090 D的话,性能领先幅度则可以扩大至35%以上。
图像视频创作性能测试
游戏测完,下面就来看一下创作者们比较关心的生产力性能,在PCMark10 Extended测试,iGame GeForce RTX 5090 D Advanced在游戏、数位内容创作方面的表现更佳,基本上要比RTX 4090 D高7-9%左右,而生产力方面的成绩则比较低,推测是目前驱动还不完善所致。
办公软件测试中,RTX 5090 D也有不错的表现,总体性能比上代的RTX 4090或RTX 4090 D都要高8%,其主要领先在PPT以及Outlook两项,性能分别比RTX 4090 D高15%以及20%,打工人有福了!
在UL Procyon的图像和视频编辑基准测试中,iGame GeForce RTX 5090 D Advanced整体相比RTX 4090或RTX 4090 D也有小幅提升。不过提升比较大的还是视频编辑部分,究其原因还是因为这一代RTX 5090 D再度对编码器进行了升级,不仅数量更多,支持的格式也更丰富。
在Adobe以及达芬奇的Benchmark测试里也能很好的体现出这一点,例如在PR以及达芬奇的测试中,iGame GeForce RTX 5090 D Advanced分别领先RTX 4090 D约15%和30%,还是非常夸张的。
3D渲染创作性能测试
看完了图像视频方面的创作,我们再把目光投向3D渲染以及工业领域的软件中,看看RTX 50系显卡又有怎样的精彩表现。还是熟悉的朋友Blender以及V-Ray,在这两款软件中,RTX 5090 D的表现也是大杀四方,每一项都能领先上代显卡40%以上,部分场景甚至可以领先至52%。
再看看另外一款渲染器,D5 Render是一款基于DXR和光线追踪技术构建的GPU渲染器。正因为其有光线追踪技术,其渲染的画面相当出色。这款软件在RTX 40系显卡测试时支持了DLSS 3帧生成,而现在随着RTX 50系显卡的发布,它也可以通过NVIDIA App的方式支持最新的DLSS 4多帧生成功能。
实测在开启DLSS 4以后,整个渲染预览的界面变得丝滑流畅,帧数基本都在240 FPS附近,而对比不开DLSS时,仅59 FPS的表现来看,性能几乎是提升了4倍以上。
再看看工业领域的表现,SPEC2020能够反应显卡的工业能力,在多项测试中iGame GeForce RTX 5090 D Advanced依旧傲视群雄,对比RTX 4090 D平均有35%的提升,而对比RTX 4090也在30%左右。
NVIDIA编解码测试
接下来的测试则是介绍RTX 50系显卡的编解码器,GeForce RTX 50系列显卡上换装了第9代NVENC编码器与第6代NVDEC解码器,在视频规格上支持AV1 UHQ(超高画质 AV1)与MV-HEVC(多视角HEVC)编解码。同时由于GeForce RTX 50系列显卡还升级支持DisplayPort 2.1 UHBR20输出,单一通道支持20Gbps带宽,因此用户可以体验到令人惊叹的HDR视觉效果、超高分辨率和更流畅的游戏体验。
这里我们直接使用NVIDIA提供的8K片源与工程文件分别测试AV1、H.265以及H.264下的编码导出时间。实测同一段素材下,iGame GeForce RTX 5090 D Advanced导出三段视频的时间分别是12秒、27秒以及24秒,效率分别比RTX 4090快了58%、15%以及21%。
同时,我们也对导出的不同格式的视频进行了画质对比,实测AV1编码的视频在画质上与H.265或H.264也没有明显差距,无论是在文字、人像还是建筑等画面里,三者的画质可以说是伯仲之间,如果不特地标注其格式,一般人很难用肉眼分辨出来。随着目前越来越多视频网站、剪辑软件和硬件厂商的推动,未来AV1势必会成为下一个最受欢迎的格式。
值得一提的是,GeForce RTX 50系显卡还能够支持4:2:2色度取样的视频编解码,这将节省CPU的负担,加快创作速度。这里我们进行了测试,实测导出时间甚至更快了一些。而RTX 40系显卡则不支持该功能,仅支持4:2:0色度采样。
4:2:2色度采样的视频文件采用的是YUV颜色格式,与存储红色、绿色和蓝色(RGB)值不同,颜色被存储为亮度Y、蓝差色度U和红差色度V。在这类视频中,视频的完整亮度将被保留,而原始色度信息只保留一半,因此相比4:4:4的视频,其视频帧数据量仅有不到三分之二,而相比4:2:0的视频又能提供两倍的颜色分辨率,因此创作者采用这种格式拍摄,能够在保留更多色彩信息的同时还能减少文件大小和带宽需求。
AI性能测试
AI是老黄在CES上谈及的重点,而RTX 50系显卡上针对AI性能的改进则是加入了对FP4精度模型加速处理的支持,它相比此前RTX 40系上的FP8精度,能够实现更快的生成速度,同时显存占用也更低。
不信你看,我们用UL Procyon的FLUX.1 AI Image Generation Demo For NVIDIA进行测试。在均使用FP8精度模型时,iGame GeForce RTX 5090 D Advanced能够做到6.635s即生成一张图,这个速度已经比上代显卡快了80%左右了;而切换到FP4精度模型后,速度就更加逆天了,生成图片的速度能够提升到3.884秒一张,相比之前的FP8又缩短了一倍的时间,此时如果对比RTX 4090,效率将是其四倍之多。
并且FP4精度模型生成的图片也非常能打,从下图就能看出来,其与FP8生成的图片几乎没有区别,无论是对关键词的理解还是图像的质量,都非常有保障,新时代AIGC玩家的最佳选择了。
再看看iGame GeForce RTX 5090 D Advanced在Stable Diffusion中的表现如何,还是用UL Procyon进行测试,在比较轻松的SD 1.5文生图测试里,无论是采用FP16精度模型还是INT8精度模型,RTX 5090 D的表现堪称神迹,特别是在INT8精度下,生成一张图的速度仅需0.392秒,效率比上代显卡快了60%。而即便是在压力比较大的SDXL中,优势也非常明显,生成一张图的速度为5.546秒,也远比RTX 4090的7.284秒要快很多。
iGame GeForce RTX 5090 D Advanced在大语言模型的表现上同样精彩,我们用MLPerf Client v0.5大语言模型进行测试,它是基于meta的Llama 2 7B开源LLM打造,涵盖了四项AI任务,分别是内容生成、创意写作以及对两份不同长度文本进行总结摘要。实测iGame GeForce RTX 5090 D Advanced在每一项中都表现出了绝对的统治力,各项领先幅度均在40%以上。
接着我们又用UL Procyon的AI Text Generation测试了更多的大语言模型,RTX 5090 D就是目前消费级市场最强的AI神器!在以Llama 3.1 7B LLM打造的Phi-3.5测试中,新一代显卡取得5430分的成绩,相比RTX 4090 D提升了22%,相比RTX 4090则提升了18%;将参数扩大至Llama 2 13B的测试中,iGame GeForce RTX 5090 D Advanced的表现更加亮眼,6418分的表现直接领先RTX 4090或RTX 4090 D达30%以上。
功耗与温度表现
最后一项测试烤机,这也是许多玩家关注的重点,Furmark烧机20分钟后,得益于旋涡(Vortex)散热系统出色的效能,iGame GeForce RTX 5090 D Advanced的核心温度稳定在63.3度,显存温度则是70度,此时显卡的最大功率为574.9W,基本上贴着575W的TDP在跑了,风扇转速则是1800RPM,噪音不算大,在可接受的范围之内。
横向对比RTX 4090或RTX 4090 D时可以看到,虽然iGame GeForce RTX 5090 D Advanced的烤机功耗比较高,但是核心与显存的温度控制得确实不错,无论是重负载还是待机时的温度都与上代RTX 40系维持相当,旋涡(Vortex)散热系统功不可没。
评测总结
毫无疑问作为 iGame 新一代的旗舰显卡家族,iGame GeForce RTX 5090 D Advanced 32GB 不论是从外观设计、硬件堆料、散热效能还是做工水准来说,都称得上是顶级非公。全新的Blackwell架构、DLSS 4、RTX神经网络渲染等技术更是将它推向了新的高度,强悍的性能表现、稳定的温度控制和一眼吸睛的外观颜值,则向我们展示了顶级卡皇的真正实力。
在性能方面,iGame GeForce RTX 5090 D Advanced 32GB再度刷新消费级显卡记录,超高的性能释放与豪华的硬件配置让它已经不仅限于4K游戏了,4K超高刷甚至8K游戏完全不成问题。在我们的实际测试中,开启DLSS 4多帧生成功能后,RTX 5090 D高达两三百帧的表现,说一句遥遥领先丝毫不为过。与4K原生分辨率对比,性能差距最大可以去到8倍!而即便强如RTX 4090,开了DLSS 3进行对比,二者之间的性能差距依旧犹如一道不可逾越的鸿沟。
同时,这一代显卡出众的创作性能与更高的AI潜力更是让它稳坐旗舰交椅。硬件层面引入了全新的NVENC编码器,支持更多样化的视频格式,无论是图像编辑还是视频剪辑,它都比前代更高效。另外AI性能才是此次升级的重点,支持FP4精度加速,AI生图速度甚至可以做到RTX 4090的四倍!并且它还有“恐怖”的32GB GDDR7显存,能够提供惊人的数据传输效率,轻松应对高分辨率渲染及AI创作。
总的来说,iGame GeForce RTX 5090 D Advanced 32GB显卡不仅是极致游戏的利器,也是内容创作者、AI开发者与科研人员的最佳选择。面对不断发展的游戏、AI计算和图形渲染需求,iGame GeForce RTX 5090 D Advanced 32GB显卡无疑将为用户带来前所未有的使用体验,开启新的性能时代。其将于1月30日在七彩虹官网商城、京东、天猫、拼多多、抖音等电商平台及全国授权零售经销渠道同步开售,售价16499元,并且除了本次上手的这款显卡,七彩虹还同时准备了iGame Vulcan、iGame Neptune以及iGame Ultra等多个不同系列的GeForce RTX 50系显卡供用户选购!顶级旗舰引领顶级体验,感兴趣的玩家千万不要错过。