万丽星舰GeForceRTX5090DOC显卡评测:开启50系的新时代!

太平洋科技 2025-01-26 09:47:18

2025开年,硬件圈子里关注度最高的非「GeForce RTX 50系列显卡」莫属。在1月7号,CES2025展会上,NVIDIA正式发布了GeForce RTX 50系列新显卡,一石激起千层浪,全网都在热议中。半个月左右的时间,第一款GeForce RTX 50系列显卡---GeForce RTX 5090D率先迎来性能解禁。

至于为什么不是GeForce RTX 5090,而是带D的GeForce RTX 5090D,相信其中的缘由大家都知一二,就不在这里过多赘述。简单理解,GeForce RTX 5090D就是国内的50系旗舰款,你能在国内买到最强的GeForce RTX 50系显卡。GeForce RTX 5090D也没有公版卡,不过没关系,我们还有一众的AIC厂商。

PConline第一时间拿到了NVIDIA核心AIC厂商Manli万丽旗舰系列:Gallardo--GeForce RTX 5090D OC 32GB显卡,给大家送上首发评测,深入了解新一代显卡的方方面面。废话不多说,马上进入正题。

┃ NVIDIA Blackwell 架构解析

万丽GeForce RTX 5090D OC 32GB显卡由 NVIDIA 全新一代Blackwell架构提供支持。新架构的命名方式,跟过往规则一样,都是用人名。Blackwell,全名David Blackwell,大卫·布莱克威尔是一位杰出的非裔美国数学家和统计学家,也是科学史上最著名的黑人学者之一。他以在概率论、统计学、博弈论和动态规划领域的开创性贡献而闻名。

新一代的Blackwell架构,主要升级了第五代的Tensor Cores张量核心,借助FP4和DLSS4,AI算力得到大幅度的提升,最高可达4000 AI TOPS的性能。RT Cores光追核心也从第三代升级到第四代,专为Mega Geometry设计,其是新一代AI管理处理器,可同时执行AI模型和图形工作负载。另外,Blackwell采用新型的SM多单元流处理器,具有125 TFLOPS的峰值FP 32计算能力,再加上全新GDDR7显存,简直是如虎添翼。

(1)新型的SM多单元流处理器

与Ada Lovelace架构不同,Blackwell架构的SM单元重新进行了设计,SM单元内的着色单元即CUDA核心,将FP32/INT32、FP32两种不同的着色器核心,统一为FP32/INT32(总数不变),也就是之前有一半着色器核心只能处理单精度浮点数据,而现在所有的都可以同时处理整数、浮点运算,效率更高,调度也更灵活。

此外,Blackwell架构还引入了神经网络着色的方式。过去这项工作只交给CUDA核心处理,如今Tensor核心也来分担着色工作。两种核心同时运行,能够将整体的重新排序效率提升2倍之多。

(2)第五代Tensor Cores核心和第四代 RTX Cores核心

第五代Tensor Cores核心可加速重新排序,支持FP 4精度模型的加速,对比第四代Tensor Cores支持FP 8精度模型,吞吐量整整提升了2倍。基于第五代Tensor Cores的全新DLSS4技术,开启之后,性能逆天的存在。

第四代 RTX Cores 进步也十分明显,从过往的三角形相交引擎升级为三角形簇相交引擎,该引擎针对Mega Geometry进行了优化,可以更有效地处理Mega Geometry和标准几何体的簇。其效率是上一代Ada架构的2倍,同时显存使用率却只有Ada架构的75%。

AI管理处理器(AMP)

AI必将成为未来显卡发展的重点,游戏中对AI技术的应用也日益广泛。但如何高效分配显卡内部的多样化任务仍是一个挑战。比如,运行DLSS时,显卡需要同时处理语言模型和游戏引擎的交互,这两者通过GPU的不同核心生成游戏帧,将会导致每一帧的生成时间难以保持一致。

AI管理处理器(AMP)的诞生正是为了解决这些问题。它能智能化地调度资源,确保在神经渲染、帧生成和AI驱动的游戏交互中,实现高效任务分配,大幅优化玩家的游戏体验。

全新GDDR7显存

Blackwell架构带来了全新的GDDR7显存,信号编码从PAM4改成了PAM3,杂讯失真更小,信号品质更清晰,同时也能带來更高的显存运行频率以及更低的电压。根据NVIDIA的介绍,使用GDDR7显存后,数据传输速率可达GDDR6显存的2倍,功耗接近GDDR6的一半。

第九代编码器与第六代解码器

Blackwell架构换装了第九代编码器与第六代解码器,支持AV1 UHQ(超高画质 AV1)与MV-HEVC(多视角HEVC)编解码。编解码效率相比上代Ada架构,也是史诗级进步,能够大大提升创作者的视频编解码效率。

┃ 技术解析

全新DLSS 4技术

GeForce RTX 50系显卡带来了全新DLSS 4技术,其融合了NVIDIA过往的多项AI黑科技,更新了包括GeForce RTX 40系显卡支持的DLSS 3帧生成,全系列RTX显卡支持的DLSS 3.5光线重建以及DLSS 2 超分辨率和DLAA深度学习抗锯齿,而最主要的改变则是引入了DLSS 4多帧生成技术(DLSS Multi Frame Generation)。

DLSS 4多帧生成技术由GeForce RTX 50系列的第五代Tensor Core提供支持,利用AI技术对前后帧进行分析,可准确预测出每一帧的变化。

这一性能提升在《赛博朋克2077》等热门游戏中的测试中,得到了充分验证,开启DLSS 4后,游戏性能提升超过8倍,非常强悍。

目前已经有75款游戏及应用支持DLSS 4技术,包括大家耳熟能详的3A游戏《赛博朋克2077》、《霍格沃茨之遗》、《漫威争锋》、《星球大战:亡命之徒》、《黑神话:悟空》、《心灵杀手 2》、《夺宝奇兵:古老之圈》等热门作品。

NVIDIA Reflex 2技术

GeForce RTX 50系显卡从NVIDIA Reflex 升级到NVIDIA Reflex 2。过去,NVIDIA Reflex技术主要是让GPU和CPU协调同步,确保最佳响应速度和低系统延迟。它通过在游戏引擎的SDK中集成延迟优化技术,直接优化从鼠标到显示器的延迟路径。其核心功能是对CPU的运行进行更精细的控制,避免CPU过早计算,从而确保关键帧以最短时间传递到屏幕,实现更低的系统响应时间。

而NVIDIA Reflex 2则采用了一种全新的延迟优化方式,它和新的Frame Warp技术相结合,当一个帧被GPU渲染时,CPU会根据最新鼠标或手柄输入计算工作流中下一帧的视角位置Frame Warp 从 CPU 采样新的视角位置,然后将GPU刚才渲染的帧扭转到最新的视角位置。在渲染帧被发送到显示器之前,再在尽可能最新的时间内进行扭转操作,确保屏幕上反映最新鼠标输入。这有助于玩家更好地瞄准目标,更精准地跟踪敌人,提高命中率。据官方资料,开启NVIDIA Reflex 2技术,相比NVIDIA Reflex ,延迟最高可降75%!

NVIDIA还推出了一系列面向创作者和游戏玩家的AI技术

1、NVIDIA Broadcast应用为主播带来音棚音效和虚拟补光两项AI驱动功能,分别可升级麦克风音频质量、对面部重新打光,以获得更精致的直播画面。此外,Streamlabs推出的由NVIDIA ACE和Inworld驱动的智能直播助手,可担任助播、制作和技术助手的角色,增强直播效果。

2、NVIDIA ACE技术使游戏角色能像真人玩家一样感知环境、制定计划并付诸行动,未来将集成到《绝地求生》《永劫无间》等游戏中,让玩家与AI组队。

3、RTX神经网络着色器,将小型AI网络融入可编程着色器,为实时游戏带来电影级材质、光照等效果,还可使用生成式AI实时渲染逼真面孔。

适配RTX AI PC的AI基础模型,涵盖LLM、视觉语言模型、图像生成、语音、检索增强生成的嵌入模型、PDF提取和计算机视觉等应用场景,且NIM微服务及PC上运行AI的所有必要组件均已针对所有NVIDIA GPU的部署进行了优化。

┃ GeForce RTX 5090D显卡的规格解析:

接下来我们具体看下GeForce RTX 5090D的规格,直接对比上一代GeForce RTX 4090D显卡。

GeForce RTX 5090D显卡采用的是GB202-250核心设计,晶体管数量达到惊人的920亿个,给到了21760个CUDA核心,也是首款突破2万个CUDA核心的桌面显卡。相比上一代的GeForce RTX 4090D显卡的14592个CUDA核心,提升了49%左右。虽然GeForce RTX 5090D显卡的AI算力有所削减,但是前后两代仍旧是翻倍的差距。

显存方面,全方位进化。搭载全新GDDR7显存,给到32GB超大容量。且显存的位宽,速率,带宽等规格均提升明显。尤其是1792GB/s的带宽速度,比上一代产品提升了近77%。

至于其他方面,视频接口用上了最新DP2.1a接口,理论带宽速度更快,全力发挥显卡的性能。功耗的话,又又又涨了,默认TGP功耗达到惊人的575W,用料与散热稍豪华的非公版卡,分分钟钟干到600W。不过,买得起这种级别的显卡,谁还会在意那点电费呢?

▲GPU-Z参数信息

作为万丽旗下旗舰定位的显卡,GeForce RTX 5090D OC 32GB显卡的Boost频率达到2482MHz,比一般版本要高一些,当然对应的功耗也水涨船高。

PS:由于性能解禁前,规格信息不能提前公布,最新版本的GPU-Z还没能完全识别到显卡信息。

┃ 万丽GeForce RTX 5090D OC 32GB星舰显卡外观与细节设计:

万丽GeForce RTX 5090D OC 32GB星舰显卡在外包装上花了不少心思,正面代表着速度的跑道上,印有显卡正反面的渲染图。左上角是万丽的品牌LOGO,右侧印有Gallardo星舰系列LOGO,整体设计高格,主调调与显卡超跑的外观设计理念相呼应上了。

采用抽拉式的礼盒包装,奢侈品独有包装方式,体现其旗舰高端的身份。

配件上,附送了显卡的支架,银色的配色,简约风设计,上面有万丽的LOGO,使用起来也十分便捷。

附送了16pin转4个8Pin的电源转换线,方便旧款电源使用。

附送的灯光同步线,Type-C接口,一分二,一端是USB2.0接口;一端是5V/3针 ARGB接口。

万丽GeForce RTX 5090D OC 32G 星舰显卡以赛车为设计语言,很贴心地送上车牌贴,玩家可挑选自己喜欢的车牌,贴在显卡上。

显卡整体采用金属材质打造,通过压铸与丝印工艺,呈现出深邃的星空黑底色,同时巧妙地融入了赛车元素,包括旋压烫银毂风扇、仪表灯带、个性化尾灯等设计元素,让它拥有了赛车的灵魂。

“RACING” 字样的字体设计,灵动又飘逸,仿佛能让人感受到赛车在赛道上疾驰的激情与动感,进一步凸显了其赛车主题风格。

在这黑色的主体之上,前端与尾端有一抹明亮的橙色,犹如刹车的卡钳,恰到好处地点缀在卡面,带来极强的视觉冲击力。

显卡的顶部还有仪表灯带,支持ARGB灯效,上面有0到2500MHz的刻度,类似于跑车的仪表。ARGB灯效不仅支持主板的神光同步,还支持通过声音来控制,这你受得了吗?后面专门点亮后,再给大家细说。

全金属的背板设计,标志性的 “01” 赛车徽记非常醒目,进一步凸显了其赛车主题风格。

显卡的背板这个位置配备DRS空气流道系统,可以根据GPU核心的温度高低,智能开启。当温度高时,显卡风扇转动,自动打开,让散热气流能够穿透背板,直达核心。当低负载运行时,风扇停转,自动关闭,不仅让整体更美观,还能防尘。

这是打开的状态,其灵感来自赛车自动升降的尾翼。这样的设计还是业界的首次,非常有创意,看得出万丽十分用心在做设计。

它拥有独立的机械结构,用手不能压下去。且采用模块化设计,便于拆卸。

▲GIF动图:开启的瞬间

▲GIF动图:关闭的瞬间

显卡的正面配备3个100mm环形扇叶的大风扇,采用高风压设计,优化空气流动,提供强劲稳定的风量,同时保持低噪音,确保高负载下持久稳定运行。

散热风扇部分,采用了旋压烫银毂的设计,其灵感源自精密的轮毂美学理念。拥有 11 片环形扇叶,共同构成了高效的环形扇叶系统。旋压银毂11叶环形扇叶采用仿轮毂设计,叶片中部轻微凸起,边缘烫银处理,轴心位置更低,尽可能加大叶片面积。,这样的设计不仅增强了叶片的结构强度,还优化了空气动力学特性,让风扇运转时更加高效稳定。叶片边缘镶嵌着璀璨的烫银装饰,为整体设计增添了一份精致与奢华。

显卡尺寸为长359mm,宽145mm,厚度69mm,整体尺寸还是相当厚重的,对机箱兼容性提出一定的要求。

16pin的电源供电接口,单卡功耗接近600W,至少需要额定功率1000W的电源才能带得动。

配备了 1 个 HDMI 2.1 接口和 3 个 全新的DP 2.1接口,DP2.1最大带宽可达80Gbps,支持16K@30Hz、8K@120Hz和4K@144-240Hz画质输出。而DP1.4接口的带宽仅为32.4Gbps,仅支持8K@30Hz和4K@120Hz画质输出。

┃ 听舰你的声音:支持声控RGB

通过声音控制灯光,是万丽GeForce RTX 5090D OC 32GB显卡的一大卖点。这也是业界第一家支持声音控制显卡灯光的厂家。

直接说出唤醒指令:你好,星舰。

▲GIF动图:白色灯光快速闪烁两次

这时,显卡上白色灯光快速闪烁两次,我们再次给出指令,比如: 关闭灯光、打开灯光、同步灯光、呼吸灯光、闪烁灯光等,灯光就随着我们指令,准确切换过来。

▲GIF动图:呼吸的灯光模式

▲GIF动图:渐变的灯光模式

同时,也可以给出颜色变换的语言指令,比如绿色灯光、红色灯光、橙色灯光、黄色灯光等,满满都是黑科技,让玩家调节显卡灯光时,更加方便。

尾部这里,还有两处灯效设计,类似于汽车的两个车灯。

如果不用声控,也可通过win11系统动态光效同步显卡灯效。按设置>个性化>动态光效,即可实现灯光控制,包括灯光颜色,模式,速度,方向等。除此之外,它还支持目前主流主板的灯光控制软件;当然,由于系统权限是最高的,所以使用主板和声控时,需要先关闭win11系统动态光效同步显卡灯效功能。

┃ 万丽GeForce RTX 5090D OC 32GB显卡的拆解:

DRS空气流道系统的模组,可以直接拆下来。

该模组由电机来驱动,完全独立出来。

拆下另一端的金属底板,上面铺着导热的硅胶。

显卡的散热模组,规模相当庞大,可稳稳压住GB-202核心的发热。

大尺寸的均热板,直接覆盖了GPU核心及显存颗粒等元件,有效减少热点积聚,大幅提升散热效能。

全覆式鳍片复合热管,一共给到10根8mm大直径复合导热管,加上全长鳍片覆盖,热管与散热鳍片无缝连接,散热里的大满配。

这才是精华之所在,整片PCB板上,密密麻麻布满了各种电子元件,布局紧凑,做工用料肉眼可见的扎实。PCB的正中心就是GeForce RTX 5090 D显卡搭载的GB202-250的核心,周围有16颗GDDR7显存颗粒,来自三星,单颗2GB容量,一共组成32GB 512bit的显存规格。

一共多达29相供电设计,其中核心供电22相,显存供电7相,堆料太疯狂了。

┃ 性能测试:

测试平台介绍:

在上机测试之前,先来看一下本次测试所采用的硬件平台。CPU用的是Intel 酷睿 i9-14900K,与之搭档的主板是iGame Z790D5 FLOW V20,选用芝奇皇家戟DDR5-7200 2x24G内存套装。在供电方面,配备了1300W额定功率的鑫谷昆仑九重KE-1300P白金数字电源。本次测试,加入上一代GeForce RTX 4090D显卡进行性能对比测试。

┃ 3DMark理论性能测试:

基于DX12的TimeSpy和Time Spy Extreme测试中,万丽GeForce RTX 5090D OC 32GB显卡分别跑分出了47660分和26221分,领先上一代的GeForce RTX 4090D显卡分别达到40%和47%。

基于DX11的Fire Strike、Fire Strike Extreme、Fire Strike Ultra测试中,万丽GeForce RTX 5090D OC 32GB显卡分别跑分出了70332分,56898分,33410分,对比上一代显卡,提升了13%,37%,49%,分辨率越高,性能提升越明显。

Prot Royal光追测试中,万丽GeForce RTX 5090D OC 32GB显卡跑出了14522分,对比上一代显卡提升高达50%。怎么样,这个提升幅度,还可以吧?

┃ DLSS 4游戏性能测试:

DLSS 4是GeForce RTX 50系显卡提升的重点,也是本次我们测试的重点。接下来,我们将挑选了四款目前可支持DLSS 4游戏进行测试,分别是《赛博朋克2077》、《霍格沃茨之遗》、《漫威争锋》和《星球大战:亡命之徒》。

第一款游戏测试:《赛博朋克2077》

4K分辨率设定,最高画质,光追开到超速档位。测试三种模式,开启DLSS4,开启DLSS 3,关闭DLSS。记录三种设置下,平均帧/1%LOW帧的表现。

万丽GeForce RTX 5090D OC 32GB显卡在没有开启DLSS的情况下,只跑出了34.12帧,DLSS 4一开,直接干到了296.1帧,性能提升达到8倍之多,相当强悍的存在。对比DLSS 3,DLSS 4的性能提升也十分明显,接近翻倍帧数提升。

第二款游戏测试:《霍格沃茨之遗》

第二款游戏我们来测试《霍格沃茨之遗》,4K分辨率+超高画质设定,光追档位也设置为最高。

不开DLSS的情况下,万丽GeForce RTX 5090D OC 32GB显卡只能跑到127帧,一旦DLSS 4这个黑科技一开,帧数飙升至520帧,足足提升了393帧。DLSS 3对阵DLSS 4,这款游戏也有200多帧的差距。

第三款游戏测试:《漫威争锋》

《漫威争锋》是一款由漫威正版授权,网易游戏运营的多平台第三人称射击游戏。画质设定:4K分辨率+超高画质+光追最高档位设定。

万丽GeForce RTX 5090D OC 32GB显卡在DLSS 4技术的加持下,仍旧强到可怕,平均帧干到473帧,满足极致高分高刷的游戏体验。对比DLSS OFF,性能提升4倍之多; 对比DLSS 3,DLSS 4性能也提升了近2倍。

第四款游戏测试:《星球大战:亡命之徒》

第四款跑了支持DLSS 4的《星球大战:亡命之徒》,这款3A大作非常吃显卡,比较考验DLSS 4的性能。画质设定,同样是4K光追拉满。

DLSS OFF仅35帧,DLSS 3跑到146帧,而DLSS 4开启,万丽GeForce RTX 5090D OC 32GB显卡的火力全开,直接提升至258帧,流畅运行完全没有压力。

┃ 4K游戏性能测试:

在不开DLSS 4的情况下,我们测试了10款游戏,考虑到显卡的定位,只跑4K画质+最高画质,有光追的,设置全拉满。

万丽GeForce RTX 5090D OC 32GB显卡运行4K最高光追画质完全没压力,对比上一代GeForce RTX 4090D显卡,4K游戏性能的提升普遍在40%以上,有个别的游戏提升甚至在60%以上,老黄这一波诚意给的相当足。

┃ 生产力性能测试:

万丽GeForce RTX 5090D OC 32GB显卡不仅仅定位于游戏显卡,在

在AIGC内容创作以及LLM大语言模型方面的优势也十分令人期待,接下来,就来考验它的生产力性能如何?

MLPerf Client 0.5基于Meta的Llama 27B开源大语言模型,涵盖了四大AI应用任务,具体包括内容生成、创意写作以及对不同长度文本的摘要。它已经成为了新一代PC AI性能基准测试软件。

可以看到,这一代的万丽GeForce RTX 5090D OC 32GB显卡在AI大语言模型下的能力相比上一代的GeForce RTX 4090D显卡,得到长足的进步,包括内容生成,创意写作等项目,性能提升均在40%以上。

在AIGC内容创作上,使用ULProcyon FLUX.1Al Image Generation Demo For NVIDlA进行性能测试,在FP4精度模型下,生成四张图片,万丽GeForce RTX 5090D OC 32GB显卡仅用时15秒左右,而上一代GeForce RTX 4090D显卡,用时则达到79秒左右,快了近5倍。在FP8精度模型下,提升没那么明显,但也快了近一倍。

我们也使用了ULProcyon的 AI测试工具,对两款显卡AI性能进行测试。对比GeForce RTX 4090D显卡,万丽GeForce RTX 5090D OC 32GB显卡领先幅度平均在30%左右。

Blender是一款专业的三维渲染软件,自带的Benchmark软件会自动渲染测试monster/junkshop/classroom共三个场景并提供对应的测试结果供用户参考。万丽GeForce RTX 5090D OC 32GB显卡三个场景得分为7545.1分,4000.1分,3745.17分,领先上一代显卡分别为42%,52%,41%,性能表现相当突出。

接着跑了‌PugetBench Adobe全家桶测试,在达芬奇测试中,万丽GeForce RTX 5090D OC 32GB显卡性能提升明显,其他的项目中,没有跟GeForce RTX 4090D拉开太大的差距。

万丽GeForce RTX 5090D OC 32GB显卡支持第九代编码器与第六代解码器,不管是H.264,还是AV1编解码,都比上一代显卡的速度效率更快。尤其是AV1,提升幅度可达近60%。

┃ 温度与功耗测试:

我们使用FURMARK软件对显卡进行重负载的烤机测试。

万丽GeForce RTX 5090D OC 32GB显卡的GPU核心温度稳定在65.7℃,显存温度为70℃,此时核心频率运行在2197MHz高频下,风扇转速最高仅是55%,整体的散热水平处于优秀水准。而GPU功耗高达599.8W, 这功耗着实不低。

总结:

经过一番测试体验下来,GeForce RTX 5090D给我印象就两个字:真猛!老黄的诚意绝对满满一箩筐。对游戏而言,DLSS 4 带来巨大性能提升,助力玩家完全沉浸于4K高分高刷的画质下畅玩各类的3A大作。对于创作者而言,带D的RTX 5090D虽然AI性能被砍了,但是它仍旧是王者般的存在,各种技术迭代升级,已经让它变得无所不能。

回归到这一张万丽GeForce RTX 5090D OC 32GB显卡上,其凭借着优秀的架构设计,强大的性能表现,酷炫超跑赛车外观设计,支持声控ARGB灯效,搭载DRS空气流道系统等创新,为非公版的GeForce RTX 5090D树立全新的标杆。相信它会在高端旗舰显卡市场占据一席之地。

除了上面星舰,万丽这次首发的GeForce RTX 5090 D系列,还有一款MSRP售价16499元的Manli万丽星际 GeForce RTX 5090D 32G,它以纯白基底打造,搭配多彩琉光饰面,搭载大尺寸VC均热板和3*10+7*8mm复合热管,特调扇叶加上星轨导流鳍片设计,提供极佳的静音,同时也支持Win11 Dynamic Lighting和主板灯光同步。

0 阅读:1