影驰GeFroceRTX5090D大将评测:DLSS4助力,4K高刷畅玩光追游戏

超能网 2025-01-24 22:36:06

NVIDIA的Ada Lovelace架构RTX 40系显卡是在2022年10月推出了,现在一眨眼两年多过去了,全新的Blackwell架构GPU将接替他们的位置,在CES 2025上NVIDIA拿出了首批RTX 50系显卡,包括为RTX 5090、RTX 5080、RTX 5070 Ti、RTX 5070、以及合规版RTX 5090 D,国内首发的是自然是RTX 5090 D,它与此前的RTX 4090 D直接削CUDA数量不同,RTX 5090和RTX 5090 D的硬件规格是一样的,只是RTX 5090 D的AI性能被限制了。

作为NVIDIA的核心合作伙伴,影驰也第一时间推出了GeForce RTX 5090 D大将这款显卡,当然他们后续还会有更多的RTX 5090 D新品,星曜系列年后回来估计就会和大家见面。

GeForce RTX 5090 D简介

GeForce RTX 5090 D搭载的是GB202,与RTX 4090 D的AD102相比,芯片面积更大,从608mm²增至750mm²,晶体管数量也从763亿个增加至922亿个。GB202和AD102的晶体管密度分别为122.9MTr/mm²和124.9MTr/mm²,可见在制造工艺上两者非常接近。

完整的GB202 GPU包括12个GPC、96个TPC、192个SM、以及1个带有16个32位内存控制器的512位内存接口,共有24576个CUDA核心、192个第四代RT Core和768个第五代Tensor Core、以及768个纹理单元。

如果与AD102做比较,会发现GB202在结构上有一些不同:同样是12个GPC,但是每个GPC里的TPC和SM数量增多了,TPC从6个增至8个,SM从12个增至16个;显存位宽也从384-bit增至512-bit,加上采用了新一代的GDDR7,带宽明显增大;NVENC与NVDEC从3+3组合变成了4+4;另外还新增了AI Management Processor。

与过往一样,即便是顶级型号也没有启用全部的核心,RTX 5090 D做了一些削减,CUDA核心数量为21760个,相比RTX 4090 D的14592个CUDA核心数量大幅度增加了约49%,基础频率和加速频率都有所降低,另外整卡功耗提升至575W,比起原来的425W也有较大增长,接近了12V-2×6接口600W的极限。新一代旗舰显卡另外一个比较大的变化在于显存,将配备32GB的GDDR7,显存位宽也从384位提升至512位,显存速率为28Gbps,显存带宽也从1008GB/s暴增至1790GB/s。

Ada Lovelace和之前的GPU架构上,在H.264和H.265视频中提供了对4:2:0色度采样的支持,Blackwell架构则增加了编码和解码4:2:2色度采样视频的能力,这将节省CPU的负担,加快创作速度。这次RTX 5090 D配有3个NVENC编码器(第9代)与2个NVDEC解码器(第6代),而RTX 4090 D拥有的是2个NVENC编码器(第8代)和1个NVDEC解码器(第5代),无论数量和质量都得到了提升。

从上面的表格里可以看到,RTX 5090 D相比RTX 4090 D在规格方面有了较大幅度的提升,发售时官方建议零售价(MSRP)也更高了,面向的是发烧级DIY爱好者和PC游戏玩家。需要说明一点,针对国内市场发售的RTX 5090 D与RTX 5090存在一些差异,唯一的区别是AI性能,从RTX 5090的3352 AI TOPS降至RTX 5090 D的2375 AI TOPS,降低了约29%。

Blackwell架构解析神经渲染引领计算机图形学下一个时代

NVIDIA在Blackwell架构的新一代Tensor Core上,添加了对FP4浮点运算精度的支持。FP4是一种较低的量化方法,类似于文件压缩,可以减小模型推理过程中数据存储和计算量大小,提高计算效率,降低该过程对显存的要求。

与大多数模型默认使用的FP16相比,FP4使用的显存不到其一半,并使GeForce RTX 50系列GPU的性能相比上一代提升高达2倍。通过利用NVIDIA TensorRT Model Optimizer提供的高级量化方法,这些增益几乎不会影响输出质量。

由于加入了神经渲染,Blackwell架构GPU的SM设计也发生了变化,与Tensor Core的结合变得更加紧密,以便在传统渲染管线中加入AI相关的功能。同时Shader Core也不再区分处理INT32 / FP32以及仅FP32的部分,全部都可以操作INT32 / FP32。通过传统Shader Core与Tensor Core的进一步结合,打造出RTX神经着色器(RTX Neural Shaders),将小型神经网络带入可编程着色器中。

The RTX Neural Shaders SDK允许开发者在RTX AI PC上训练他们的游戏数据和着色器代码,并使用Tensor Cores在运行时加速其神经表示和模型权重。在训练过程中,神经游戏数据与传统数据的输出进行比较,并经过多次循环进行优化。开发者可以使用Slang(一种将大型复杂函数拆分为更易处理的小部分的着色语言),以此简化训练过程。

这项突破性技术用于三种应用:RTX神经纹理压缩、RTX神经材质和神经网络辐射缓存(NRC)。RTX神经纹理压缩使用AI在不到一分钟的时间内压缩数千种纹理,在相同的视觉质量下可以节省高达7倍的显存占用;RTX神经材质是使用AI压缩通常保留给离线材质的复杂着色器代码,并且这些材质由多层组成,处理速度可提升5倍;神经网络辐射缓存使用在实时游戏数据上训练的神经网络,能更准确和高效地估计游戏场景中的间接光照,而大幅减少光线追踪的计算量。

在RT Core方面,NVIDIA主要提升了检测光线、路径与三角形相交的效能,现在检测能够以簇集方式进行,另外也有三角形簇集解压缩引擎。其中新增支持Linear-swept Spheres(LSS),可以减少渲染毛发所需的几何图形数量,并使用球体代替三角形以获得更准确的毛发形状拟合,具有更好的性能和较小的显存占用。

考虑到AI在游戏内的应用越来越普遍,如何分配显卡内部的多样化工作成为了新的问题。为此NVIDIA在Blackwell架构GPU上加入了AI Management Processor,可以根据不同的实际情况调整数据处理的优先权,以提升反映速度,维持运算效率。对于广泛应用的DLSS来说,可以多帧生成提供一致的画面生成时间。

Blackwell架构GPU除了整体设计的提升外,很重要一点是加入了对GDDR7的支持。与现有GDDR6使用的NRZ/PAM2或GDDT6X的PAM4信号编码机制不同,GDDR7采用的是PAM3信号编码机制。NRZ/PAM2每周期提供1位的数据传输,PAM4每周期提供2位的数据传输,而PAM3每两个周期的数据传输为3位。整体而言,能够降低耗电,带宽也得到了再次提升。

NVIDIA在电源效率上也下了不少功夫,不仅针对笔记本电脑使用的型号,台式机使用的GeForce RTX 50系列显卡也因此受惠。NVIDIA针对闲置运算单元,在原有基础上加入了电源轨闸控(Rail Gating),可单独微调非频繁操作区域的供电状况。

DLSS 4支持多帧生成功能并升级模型

新一代Blackwell架构GPU上引入了DLSS 4,具备多帧生成功能,在每个传统渲染的帧之间生成多达三个额外的帧。DLSS 4还加入了自2020年发布DLSS 2.0以来对其AI模型的最大升级,DLSS光线重建、DLSS超分辨率和DLAA将由Transformer模型驱动,这是Transformer模型首次在图形领域的实时应用。DLSS Transformer模型通过改进的时间稳定性、减少鬼影以及运动中的更高细节来提升图像质量,将进一步提升RTX 20/30/40系列显卡的DLSS性能体验。

DLSS 3帧生成的AI模型使用游戏数据,如运动矢向量和深度信息,以及来自GeForce RTX 40系列光流加速器的光流场来生成一个额外的帧。这种方式生成多个帧的成本过高,因为每次生成新帧都需要光流加速器和AI模型,并且性能开销会限制GPU,导致输入帧率降低。

DLSS 4多帧生成结合了多项Blackwell架构的硬件技术和DLSS创新,实现了多帧生成。新的帧生成AI模型快了40%,使用的显存减少了30%,并且只需每渲染一帧运行一次即可生成多帧。NVIDIA通过用一个非常高效的AI模型替换硬件光流加速器来加速光流场的生成,显著降低了生成额外帧的计算成本。

利用Blackwell架构GPU的第五代Tensor Core,AI处理性能提升了最多2.5倍。一旦生成了新的多个帧,它们就会被均匀地安排,以提供流畅的视觉体验。过去DLSS 3帧生成使用基于CPU的帧调度,其变异性可能会随着额外帧的增加而累积,导致每帧之间的帧调度不一致,影响流畅性。

为了解决生成多个帧的复杂性,Blackwell架构GPU使用Flip Metering,将帧率逻辑转移到显示引擎中,使得GPU能够更精确地管理显示时间。同时显示引擎还增强了两倍的像素处理能力,以支持更高的分辨率和刷新率,从而实现带有DLSS 4的Flip Metering。

对于游戏和应用,DLSS 4结合多帧生成、光线重建和超级分辨率技术,将帧率提升至普通渲染的最高8倍,并在从帧生成升级到多帧生成时,进一步提高帧率高达1.7倍,性能提升效果非常地明显。

之前DLSS使用卷积神经网络(CNN)通过分析局部上下文并在连续帧中跟踪这些区域的变化来生成新像素,经过六年的持续改进,已经达到了极限。新的DLSS Transformer模型使用了视觉Transformer变压器,使自注意力机制操作能够评估整个帧中每个像素的相对重要性,并且跨越多个帧。

DLSS Transformer模型采用两倍于CNN模型的参数来实现对场景的更深层次理解,从而生成提供更高稳定性、减少鬼影、运动细节更多以及场景边缘更平滑的像素。在密集的光线追踪内容里,新的DLSS Transformer模型能大幅提升图像质量,在复杂的光照条件下会有更明显的优势,稳定性会加强,重影会减少,闪烁现象也会消失。

预计在未来数年里,图像质量会持续提升。

Reflex 2首次采用Frame Warp技术

过去四年里,NVIDIA Reflex已集成到超过100款游戏中,可以将PC延迟降低50%。在新一代Blackwell架构GPU上,NVIDIA带来了NVIDIA Reflex 2,结合了Reflex低延迟模式和新的Frame Warp技术,把最新的鼠标输入指令同步给渲染帧,及时更新渲染的游戏帧并在渲染帧被发送到显示器之前获取最新的鼠标信息,通过刷新渲染的游戏帧以进一步减少延迟,将PC延迟进一步降低多达75%。

在电子游戏里,玩家的每个动作都会经过复杂的计算,然后在屏幕上显示,其中的每一步都会增加延迟。来自键盘和鼠标的输入传输给游戏,由CPU进行计算其在游戏中的效果。操作的结果被置于渲染队列中,队列被传输给GPU进行渲染,最后输出到显示器。整个过程大概需要几十毫秒,但卡顿和其他滞后情况会增加延迟。

NVIDIA Reflex 2首次采用了Frame Warp技术,是另一种减少延迟的方法。当一个帧被GPU渲染时,CPU会根据最新鼠标或手柄输入计算工作流中下一帧的视角位置。Frame Warp从CPU采样新的视角位置,然后将GPU刚才渲染的帧扭转到最新的视角位置。在渲染帧被发送到显示器之前,在尽可能最新的时间进行扭转操作,确保屏幕上反映最新鼠标输入。

当Frame Warp转移游戏像素时,图像中会产生缝隙撕裂的空白像素,镜头位置的变化会让游戏场景中显示之前没有渲染的新像素。NVIDIA开发了一种优化了延迟的预测渲染算法,使用来自先前帧的视角、颜色和深度数据,对这些撕裂的空白像素进行准确的图像修复。玩家可以通过更新的视角看到没有撕裂的渲染帧,并降低了改变游戏内视角位置而产生的延迟。这有助于玩家更好地瞄准目标,更精准地跟踪敌人,提高命中率。

NVENC和NVDEC新增YUV422支持

Ada Lovelace和之前的GPU架构上,在H.264和H.265视频中提供了对4:2:0色度采样的支持,Blackwell架构则增加了编码和解码4:2:2色度采样视频的能力,NVENC和NVDNC分别升级至第9代和第6代。

在YUV 4:2:2视频中,完整的亮度值被保留,并且只保留原始色度颜色信息的一半。一个4:2:2压缩的视频帧只需要未压缩的4:4:4视频帧数据量的2/3,但相比4:2:0色度压缩帧提供了两倍的颜色分辨率。这意味着能在保留更多色彩信息的同时还能减少文件大小和带宽需求之间取得了更好的平衡,额外保留的色彩信息对于HDR内容特别有帮助,能提升拍摄和编辑及色彩校正的质量。

影驰GeForce RTX 5090 D 大将显卡介绍

其实影驰在RTX 40系列的产品线里面,在RTX 4080以上都没有将系列的产品,这次RTX 50影驰将系列回归高端产品,当然了将系列的产品在影驰的产品定位中是较低的,所以这款影驰GeForce RTX 5090 D 大将频率与TGP都和公版一样,当然它的价格也是官方的建议零售价一样,卖16499元。

影驰GeForce RTX 5090 D 大将的包装就很能体现大将风范,有四颗星、“General”,还有正中间的“将”字,可以说是满满军事风,而它的背后则印有RTX 50系的新特性。

显卡不含挡板的尺寸是长324mm,高132mm,厚60mm,是标准的三槽厚度,在各款RTX 5090 D当中尺寸算是比较小的,有较好的机箱兼容性。

显卡的重量是1879克,并不算轻,但在同类中重量已经较低的了

配件包括一个金属显卡支架、一根12V-2x6转4个8pin的转接线,还有一根ARGB同步线

影驰GeForce RTX 5090 D 大将使用 的游星X散热器,配备了两把10cm和一把9cm霜环风扇,使用非常特别的三折扇叶,扇叶数量从上代的11叶改善为7叶,同噪音下风压提升了15%,同转速下噪音降低5%,风压提升10%,采用环叶扇设计有效提升扇叶整体强度,风扇支持智能启停功能,在待机时会停转让噪音变成0。

散热器的整流罩采用旭日黑铠主题设计,黑色主体搭配彩光展现了机械与艺术的融合,黑色碳纤维纹路与几何线条交错布置,整体风格简约且极具科技感。侧面镶嵌有炫彩RGB灯效,以流线型的电路图案为装饰,进一步突出赛博科技风格。

显卡通电亮灯后的样子,除了侧面的炫彩RGB灯外,正面的三把风扇也是自带ARGB灯效的,显卡的灯效都可与使用12V-2x6旁的灯光同步口与主板的ARGB口相连,与主板灯效同步。

视频输出接口方面,影驰GeForce RTX 5090 D 大将配备了三个DisplayPort 2.1b和一个HDMI 2.1接口。其中DisplayPort 2.1b支持UHBR 20,提供了最大80Gbps的带宽,可带来最高16K(15360 x 8460)@60Hz(需要DSC)、8K(7680 x 4320)@120Hz(需要DSC)、4K(3940 x 2160)@ 240Hz的输出。不过需要注意的是,最高链路速率需要DP80LL认证的电缆。

12V-2x6供电口是反转的,可以减少接口挤占散热器的空间,旁边的是ARGB同步口

显卡配有全金属加固背板,同时它也有辅助散热的作用,背板上有大面积的开孔,第三把风扇的风穿透鳍片后可以直接通过,没有PCB的阻挡大幅降低了风阻,这种贯穿设计可提供更好的显卡散热效果。

显卡拆解

游星X散热器底部采用大面积均热板与GPU接触,可以非常高效地把GPU热量传递给热管,为了给这块TGP高达575W的显卡散热,这个散热器一共用了多达7根8mm直径热管,采用回流焊与鳍片相连,并且采用了较高密度的鳍片布局,鳍片间距大概1.4mm,所有的热管和鳍片都有做表面镀镍处理。

影驰还为这个散热器做了一体压铸合金中框,这中框相当坚固,它直接与PCIe挡板相连而且长度与PCB相同,与金属背板一齐保护PCB不变形,另外散热器在显存、Mosfet以及电感位置都配有导热垫,可以把这些高热元件的热量也传递到散热器上,降低他们的工作温度。

显卡所配备的金属背板在GPU的位置也贴了导热垫,可以把GPU背面的热量传递到背板上,起到一定的散热作用。

影驰GeForce RTX 5090 D 大将采用14层的非公版PCB,可以看到显卡上面的元件布局非常紧凑,基本上元件都把PCB占满了,没多少多余的空间。GDDR7显存和GPU的间距非常近,而且这次RTX 5090 D采用了512bit/32GB GDDR7显存,所以GPU四周一共有16颗显存把它包围,左右两侧各有5颗,上放有四颗,下面还有两颗。

巨大的GB202-250-A1 GPU

显存是三星的K4VAF325ZC-SC28,单颗容量2GB,速率是28Gbps

影驰GeForce RTX 5090 D 大将显卡一共使用了29相供电,包括16相NVVDD供电、6相MSVDD供电和7相显存供电,当中NVVDD和MSVDD其实都是GPU的供电,所以其实也可以简单看作22相GPU核心供电,这7相显存供电是分散布置的,比较明显的就是那6个单独布置的电感,还有一相藏在右侧那堆GPU供电里面,所用的MOSFET全部是来自于MPS的MP97993,单颗输出能到50A。

这颗MPS MP29816 PWM主控芯片控制了16相NVVDD供电和7相显存供电,根据资料它是一个双环路16相PWM控制器,但每相PWM可控制两颗DrMOS,所以可以控制这16+7相供电。

背面这颗uS5650Q负责控制6相MSVDD供电

测试平台

为了让RTX 5090 D发挥出最好的游戏性能,我们使用了锐龙7 9800X3D这款目前最好的游戏处理器,搭配微星MPG X870E CARBON WIFI 暗黑主板,内存是芝奇 焰锋戟 DDR5-6000 CL30 16GB*2套装,AMD的处理器还是适合搭配低时序的6000MHz内存,为了能给这张显卡提供充足的电量,我们选择了航嘉 MVP P1600X电源。对比显卡选了上代的RTX 4090D,来看看新一代的旗舰显卡能比之前有多少提升。

基准测试

基准测试还是使用我们熟悉的3DMark来进行。其中,Fire Strike、Fire Strike Extreme和Fire Strike Ultra测试了显卡在DX 11中,1080P、2K和4K下的表现。而Steel Nomad、Time Spy和Time Spy Extreme测试的是显卡在DX 12中,2K和4K下的表现。Port Royal是针对显卡光追性能的测试。Speed Way测试的是显卡在DX 12U中的表现,包含DXR光追。

在3DMark测试中可以看到,影驰GeForce RTX 5090 D 大将平均要比RTX 4090 D快约47%,在Steel Nomad和Port Royal两个测试中拥有相当明显的优势,领先幅度都在50%以上,优势非常大,其他测试项目的性能提升幅度也非常高,Speed Way也有接近50%的增幅。

游戏测试

在这次游戏测试环节中,我们在4K分辨率选择了7款光栅化游戏及光追游戏,2K分辨率选择了4款光栅化游戏及光追游戏,另外还有3款DLSS 4游戏。一般情况下,游戏会选择极高或者超高的预设画质,光追游戏如果有路径光追都会是优先选项,同时这些测试里都没有开启DLSS。由于GeForce RTX 5090 D属于旗舰显卡,基本上都是以4K游戏为目标,2K游戏作为参考,测试不包含FHD分辨率下的表现。

4K光栅游戏

在4K光栅游戏的环节,RTX 5090 D基本上没什么压力,即便是负载最大的《黑神话:悟空》,也能保持在60fps附近, 其他游戏大部分帧率都超过100fps,而RTX 4090 D绝大部分时候也能很好地应付,在该设置下RTX 5090 D整体领先RTX 4090 D大概42%。

4K光追游戏

到了4K光追游戏,两者的性能差距就显得明显一些,不过RTX 4090 D不能流畅运行的部分,新一代显卡也不会太好。如果玩家想以4K原生分辨率运行光追游戏,在部分游戏里还是显得有点高。目前来看,玩家想畅玩4K光追游戏,还是离不开DLSS,在该设置下RTX 5090 D整体领先RTX 4090 D大概44%。

2K光栅游戏

无论RTX 5090 D,还是RTX 4090 D,面对2K光栅游戏都是毫无压力,最难对付的《黑神话:悟空》也能保持在60fps以上的位置 ,其他的游戏帧率都在144fps以上,所以对于那些拥有2K高刷屏的玩家来说,RTX 5090 D这种表现相当完美,在2K光栅化下,RTX 5090 D整体领先RTX 4090 D大概35%,没4K时那么高。

2K光追游戏

到了2K光追游戏,RTX 5090 D相比RTX 4090 D倒是有质的变化,此前RTX 4090 D跑不满60fps的游戏,换RTX 5090 D 就能提升至60fps流畅帧率,在2K光追时RTX 5090 D整体领先RTX 4090 D大概31%。

DLSS 4性能测试

在DLSS 4测试项目中,我们选择了四款游戏,包括《赛博朋克2077》、《心灵杀手2》、《星球大战:亡命之徒》和《漫威争锋》,前三款是游戏内就支持DLSS 4的,而《漫威争锋》则是通过NVIDIA App的DLSS优设功能支持——这个功能可以理解为是在驱动层面上激活DLSS,玩家可以利用这个功能为一些游戏提速,毕竟不是所有游戏都完整集成DLSS的所有功能。测试内容除了原生帧率外,还有新旧两种不同模型,以及不同倍数的设置,让大家可以更好地去做对比。需要说明的是,《星球大战:亡命之徒》不支持DLSS新旧模型切换。

丰富的设置可以让大家更好地看到不同设置下的差异,综合来看,DLSS 4的帧生成倍数调整对于帧率提升很明显,让游戏变得更加流畅,同时延迟的影响也没有明显增加,处于能够接受的水平,对于玩家来说是有利的。另外需要说明的是,如果玩家选择质量档位,那么延迟会比性能档位有所增加。而CNN和Transformer两个模型似乎对游戏帧率没什么影响,因为被测游戏里面只有两款是原生支持模型切换的,所以这个结论其实不太好下,还得看以后的表现。

之前NVIDIA在介绍时,表示Transformer模型也将进一步提升RTX 20/30/40系列显卡的DLSS性能体验,也就是说这也是老用户的福利。对比Transformer和CNN两个新旧模型,前者在细节处理上会更好,画面质量得到提升,这点在一些室内场景会更为明显,比如一些物品的边缘位置,纹理更清晰,闪烁现象会更少。

AI与生产力测试AI生图与大语言模型

由于RTX 50系GPU的Tenser Core增加了对FP4运算的加速支持,所以RTX 5090 D使用FLUX.1模型FP4精度时,图像生成所用时间只需RTX 4090 D的五分之一,效果十分明显,如果大家都用FP8精度,RTX 5090 D也只用了60%的时间就完成了工作。

关于Stable Diffusion FP16精度的对比测试,测试时由于TensorRT加速库还没更新对RTX 50系列的支持,所以我们是用ONNX DirectML运行时进行测试的。 在这个测试中,RTX 5090 D仍然领先RTX 4090 D不少。附带一提,其实可以看到即便是ONNX DirectML运行时,RTX 5090 D的生成速度也挺快的了,要是有TensorRT的话,这时间肯定还会更短一点。

在AI文本生成测试,RTX 5090 D依然保持着一定的领先优势,幅度基本都在30%以上。到了MLPref测试,生成速度也是类似,响应时间则降至100ms以内,缩短了大概50ms,虽然说RTX 5090 D与RTX 4090 D的AI算力是比较接近的,但由于RTX 5090 D有着更高的显存带宽,所以实际跑AI应用还是明显比RTX 4090 D更快。

生产力创意软件

RTX 5090 D在生产力上领先RTX 4090 D基本都是25%以上,幅度较为明显,对于有这方面需求的用户来说是个好消息。

温度测试

我们的GPU散热测试均在裸机状态(如果安装在机箱内,GPU温度会高出5℃左右)下进行测试,测试环境温度约为23℃。待机温度是开机以后记录5分钟,满载温度则是完成3DMark Speed Way压力测试后记录下,数据通过GPU-Z的Log to File功能记录,以下为温度测试曲线。

影驰GeForce RTX 5090 D 大将支持风扇待机停转,所以待机温度都是被动散热下的温度,经过5分钟的待机测试,温度缓慢降至40℃左右。满载状态下,最高温度为72℃,对于一块600W的显卡来说温度并不算高,而且它是采用三槽设计的,散热面积肯定要比其他3.5槽设计的非公版低,能做到这温度已经很不错了。

影驰GeForce RTX 5090 D 大将在待机时风扇是会停转的,让它在待机状态下完全无任何噪音。当负载和温度超过一定程度后风扇就会启动,显卡的三把风扇都是独立控制的,但转速被调教得比较接近,中间的9cm风扇转速和两侧的10cm风扇是差不多的,满载状态下,风扇最高转速在1889RPM,平均转速在1880RPM左右。

功耗测试

通过我们手中的PCAT套件,可以分别精确地测量显卡PCIe、外接电源接口瓦特数,显卡最大功耗在3DMark Speed Way压力测试中获得,待机功耗则是在进入系统后记录1分钟取平均值。

统计功耗测试的结果算出,这张影驰GeForce RTX 5090 D 大将的整卡待机功耗平均为30W,满载功耗平均为613W,峰值功耗则是710W,而上代的RTX 4090的平均满载功耗只有425W左右,这功耗明显比上代高了许多,高了44%左右,所以对电源的需求也急剧升高,至少得配1000W的电源才能带动这显卡。

噪音测试

上面的测试所知显卡满载时风扇最高转速是1880RPM,我们是把显卡放进了环境噪音小于10 dBA的消音房,把其风扇调成同样转速,然后在30厘米的距离上测试其噪音水平,由于显卡在待机时风扇是停转的,所以就不用测试了。

影驰GeForce RTX 5090 D 大将在测试时的声音略大,测出来达到了49.3dBA,这声音听上去像是风吹到鳍片上产生振动响声,不像是扇叶的风切声,做成三槽虽然体积上有优势,但散热和静音总得牺牲一个。

全文总结

其实最初看到GeForce RTX 5090 D那个规格时,除了感叹GPU核心规模的增长外,对显卡的TGP提升也十分惊讶,从上代旗舰的425W暴增到575W,功耗提升了35%之多,差不多就是12V-2x6供电口的上限,但经过测试下来,它的性能比上代旗舰有超过40%的游戏性能提升,这功耗提升是有明显收益的,而且这还是不算DLSS 4多帧生成所带来的提升,如果按那个来算的话提升幅度就很大了。

可以说2K分辨率下的光追游戏对于影驰GeForce RTX 5090 D 大将来说几乎没有任何压力,即使不借助DLSS也很流畅。当然了会买这张显卡的玩家应该大部分都想在4K分辨率下玩游戏,纯光栅的话压力也不大,光追的话部分游戏就得借助DLSS了,全新的DLSS 4加入了多帧生成技术,能以倍数级别把帧率提升到喂饱高刷屏的程度,4K高刷光追游戏不再是梦。

此外NVIDIA这次还更新了DLSS超分辨率的模型,新的Transformer模型对细节的修复比起旧CNN模型更胜一筹,带来了更好的画质,而多帧生成带来的延迟问题也会交由Reflex 2去解决。

影驰GeForce RTX 5090 D 大将是很标准的3槽卡,这在非公的RTX 5090 D当中是比较少见的,大部分都做到3.5槽甚至3.75槽,要论机箱适装性来说肯定是三槽的影驰GeForce RTX 5090 D 大将好得多。而且我们在做双卡测试时发现3槽的影驰GeForce RTX 5090 D 大将有巨大的优势,它基本不挑主板,基本上所有配备双PCIe 5.0插槽的主板都能安装两张这种显卡,而3.5槽以上的显卡就很挑主板,而且两张3.5槽以上的卡由于显卡间距过小,主卡的温度严重偏高,三槽的影驰GeForce RTX 5090 D 大将就没那么严重。

价格方面,影驰GeForce RTX 5090 D 大将和NVIDIA的官方建议零售价一样是16499元,虽然它维持了公版频率,但性能表现依然十分出色,拥有非常强劲的游戏以及AI性能,优秀的散热设计使其在维持三槽厚度的同时保持较低的温度,三槽的设计使其有较好的机箱兼容性,是一款非常优秀的产品,当然了如果想追求更好性能和散热的话,可以等等年后的星曜产品。

0 阅读:0

超能网

简介:专注优质创作,致力价值传播。