Blackwell甜点驾临——NVIDIAGeForceRTX5070FE初探雅评

微型计算机 2025-03-05 09:48:43

宛若诗中所言:“云销雨霁,彩彻区明。”于大多数平凡之游戏玩家与设计创作之士,或许斯时,乃更替Blackwell之良机也,恰如古人所云:“及时当勉力,岁月不待人。”

好吧说人话。不要再抱怨和眼热RTX 5090、5080啦!价格更亲民的RTX 5070已经来到,首发价格4599元甚至比当初RTX 4070的首发价格还低,性能远胜RTX 4070,还有DLSS 4的“无限帧率”加持和强大的AI性能护航。对绝大多数普通游戏玩家和设计创作用户来说,Ada甚至Ampere换代为Blackwell的最佳时机也许就是现在!

NVIDIA按照从高到低的市场规划,先后推出了全新Blackwell架构的第四代GeForce RTX GPU产品GeForce RTX 5090、RTX 5090 D、RTX 5080和RTX 5070 Ti四款产品。DLSS 4和超强AI性能的光环覆盖下,让很多玩家都对新的Blackwell显卡有些跃跃欲试,但苦于之前四款产品还是有些略显高贵的价格,不少人依然在持币观望,希望找到最符合心中性价比的那个“它”。

现在,Blackwell家族的第五款产品——GeForce RTX 5070,某种意义上来说也是第一款RTX 50系的甜点级产品来了,立足游戏和基础设计创作、AI应用领域的高能发挥,DLSS 4的加持甚至能轻松挑战4K全特效游戏,尤其是4599元的价格已经契合多数玩家的换代心理价格,这样的RTX 5070,你会爱吗?

GeForce RTX 5070 GPU简析

作为第五款上市的Blackwell架构GeForce RTX 50系GPU产品,RTX 5070可以肯定的就是RTX 5070 Ti的下位替代产品,也是前者的规格缩减版本。虽然是面向甜点级游戏市场的相对较为亲民的产品,但GeForce RTX 5070身上依然继承与保留了Blackwell架构全部核心技术特色。

以下为Blackwell架构的主要技术特色概括解析为多次重复内容,此处展示只是为了帮助没有了解过这部分内容的读者更好理解Blackwell架构核心特色,之前的RTX 50系产品评测中也已经多次讲过,对此部分内容熟悉的玩家请自行跳过。

●首先最核心的是,RTX 50系列GPU引入了DLSS 4多帧生成技术。这项创新技术运用了更新的Transformer模型,与传统的CNN模型相比,它将帧生成速度提高了40%,并且减少了30%的显存占用。这一进步显著提高了游戏运行效率和3D实时渲染能力,为RTX 50系列GPU带来了显著的性能提升。

●其次,在CUDA Core方面,已经实现了全面的升级,现在每个SM单元都配备了全功能单元。在Blackwell架构中,计算单元均能执行FP32或INT32计算任务,这极大地提高了INT32计算能力的上限。因此,对于那些需要大量INT计算的应用,Blackwell架构将提供更出色的性能表现。

●第三,NVIDIA在RTX 50系列显卡采用的Blackwell架构中,决定使用GDDR7显存技术以增加显存带宽。对RTX 5070来说,192位显存宽度和12Gbps的GDDR7显存,RTX 5070实现了672GB/s的显存带宽峰值,这比使用12GB GDDR6X的前一代产品RTX 4070提升了30%以上。

●第四,Blackwell采用了神经网络渲染技术,并公开了一些目前较为先进的应用神经网络技术的着色器实例。这些包括RTX Neural Materials(神经网络材质)、RTX Neural Texture Compression(神经网络纹理压缩)、RTX Neural Radiance Cache(神经网络辐射缓存)、RTX Skin(表皮材质)以及RTX Neural Faces(神经网络面孔处理)等。

●最后,RTX 50系GPU核心配置第五代Tensor Core和第四代RT Core,新增了针对FP4、FP6的支持以及第二代FP8 Transformer模型的支持,并支持RTX Mega Geometry (“几何巨块”)处理技术,在处理几乎无限细分的三角形细节时,显著提升了光线追踪的效率。

此外,GeForce RTX 50系GPU还带来了NVIDIA Reflex 2系统延迟降低技术的更新以及新增虚拟补光和录音棚音效的Broadcast进化,并支持4:2:2@10bit视频格式的硬件编解码加速。一系列新技术和新特性的加持也为玩家带来了全新的使用体验。

从硬件规格的“纸面实力”来看,GeForce RTX 5070相比RTX 5070 Ti在核心部分大约有30%多的缩减,略高于当初从RTX 4070 Ti到RTX 4070的缩减幅度(25%左右),当然这也为中间可能存在的RTX 4070 SUPER留足了位置空间。GeForce RTX 5070的核心代号为GB205-300,如果我没记错的话,x05的核心代号应该是第一次在消费级显卡的市场上出现,也不知是否有更深的考虑和含义,当然在此也不妄加揣测了。RTX 5070在硬件规格上配置了6144个CUDA核心,48个RT Core和192个Tensor Core,相比“哥哥”RTX 5070 Ti缩减了大约三分之一,综合性能上的缩减应该在20%以上。对于一款甜点级的产品而言,是否够用?后面的测试会给出答案。

在显存部分,RTX 5070仍然使用了Blackwell架构GPU最新引入的GDDR7高性能显存,容量为12GB,相比RTX 5070 Ti缩减了25%,位宽为192bit,等效显存带宽也达到了672GB/s。在视频编解码器的配置上,GeForce RTX 5070搭配了1个第九代的NVENC编码器和1个第六代NVDEC解码器,比RTX 5070 Ti少了1个NVENC,应该对硬件编解码性能有一定的影响。规格上的缩减也使得RTX 5070在功耗上相对RTX 5070 Ti缩减了20%左右,为250W,也基本算是甜点级显卡的标准功耗。

和前一代的对位产品RTX 4070相比,纸面硬件规格上RTX 5070仅有5%左右的领先。不过相比RTX 4070来说,更高的核心频率和性能更强的GDDR7显存配置以及全新Blackwell架构肯定会带来性能上的飞跃。因此我们预估RTX 5070相比RTX 4070在游戏领域内能带来非常明显的性能领先,在AI应用领域或许会更高一些,有待后续评测验证。

NVIDIA为GeForce RTX 5070推出了Founders Edition的公版产品(NVIDIA GeForce RTX 5070 Founders Edition,后文简称RTX 5070 FE。),前些日子这款产品也已经到达了MC评测室。今天的这篇评测报告,让我们先来看大家最关心的GeForce RTX 5070 FE的性能,在文章末尾我们再来赏析RTX 5070 FE的匠心精妙设计。

NVIDIA GeForce RTX 5070 Founders Edition产品资料

核心架构:Blackwell

核心代号:GB205-300

制程工艺:TSMC 4N

CUDA核心:6144

RT Core:48(第四代)

Tensor Core:192(第五代)

核心基础频率:2325MHz

核心Boost频率:2512MHz

显存容量:12GB GDDR7

显存位宽:192bit

显存带宽:672GB/s

NVENC:1个(第九代)

NVDEC:1个(第六代)

输出接口:3×DP2.1b+1×HDMI 2.1b

TDP:250W

首发指导价格:4599元

实战RTX 5070,DLSS 4加成性能比RTX 4070高80%以上

OK,现在是性能的实测环节。经过了RTX 5090 D、RTX 5080和RTX 5070 Ti的评测洗礼之后,相信《微型计算机》的读者对此也应该非常熟悉了。在这个部分,我们同样会从游戏性能、AI性能和设计创作性能三个方面对RTX 5070 FE进行全方位的性能考核。同时,DLSS 4作为可以说是划时代的游戏黑科技革命,自然会成为游戏性能测试中的重点。而在AI性能测试部分仍然是以AI文本推理生成和AI文生图的AIGC性能为主,设计创作领域内的测试主要还是视频编解码性能(包含4:2:2视频和传统视频转码)和3D渲染性能的测试。

在对比产品方面,毫无疑问前一代Ada Lovelace架构的对位产品RTX 4070会是主要参考评测目标,这是最能体现前后换代产品在性能进化方面的指标,也是每一款换代产品出现都应该测试的对象,否则产品换代的主要性能衡量指标岂不就成了“镜花水月”。同时,我们也在测试中加入了与同代上位产品RTX 5070 Ti的性能比较,以便给玩家们一个相对更加详实、准确的参考。考虑到RTX 5070的市场定位,我们主要将精力放在1440p分辨率下对它进行性能考核,同时也会测试4K和1080p分辨率下的游戏性能表现,以便给大家最完整的性能参考。

测试平台

显卡:NVIDIA GeForce RTX 5070 FE、NVIDIA GeForce RTX 5070 Ti(影驰RTX 5070 Ti魔刃)、GeForce RTX 4070 FE

处理器:AMD锐龙7 9800X3D

主板:ROG STRIX X870-A GAMING Wi-Fi吹雪

内存:影驰星曜DDR5 6000 16GB×2

硬盘:影驰星曜X4 Plus PCIe SSD 2TB

电源:ROG THOR 1200W

显示器:戴尔UP3218K(7680×4320@60Hz)

操作系统:Windows 11 24H2

驱动程序:NVIDIA Game Ready Driver 572.50

如无特殊说明后文测试数据部分及图表所示RTX 5070皆指RTX 5070 FE,RTX 4070皆代表RTX 4070 FE,RTX 5070 Ti则代表影驰RTX 5070 Ti魔刃。

3DMark理论性能

3DMark理论性能测试没啥好说的,整体测试结果来看RTX 5070相比RTX 4070有平均接近25%的性能领先,相比RTX 5070 Ti则是有约20%的性能差距。理论数据当不得真,只能做一个大致的差距参考,实际情况当然还要看实际游戏中的表现。

最后看3DMark测试中的DLSS TEST。在RTX 50系GPU发布之后,3DMark DLSS TEST中也加入了DLSS 4的特性测试。从测试结果可以看到,开启DLSS 4 4X之后,RTX 5070 FE的游戏帧率达到了原生帧率的5.5倍(Quality模式)和7倍(Performance模式)。而对比开启DLSS 3的RTX 4070,RTX 5070 FE的性能领先前者更是达到了150%(Quality模式)和160%(Performance模式),领先幅度极其巨大。

DLSS 4游戏性能表现

在1440p分辨率下,我们用7款DLSS 4游戏——《赛博朋克2077》《漫威争锋》《心灵杀手2》《星球大战:亡命之徒》《霍格沃茨之遗》《龙腾世纪:影障守护者》以及《夺宝奇兵:古老之圈》进行了相关性能检测。

从测试数据来看,如果不开启DLSS,在原生帧率状态下,RTX 5070在7款DLSS 4游戏中相比上一代的对位产品RTX 4070有平均约17%的性能领先优势。但是在开启了DLSS 4 4X平衡模式之后,对比开启DLSS 3平衡模式之后的RTX 4070 FE,RTX 5070相比RTX 4070的性能领先程度达到了50%~120%的高度,平均性能领先已经达到近90%,可以说是实现了性能上的跨维度飞跃。同时对比原生帧率的状况,可以看到开启DLSS 4 4X平衡模式之后,同为RTX 5070 FE,DLSS 4 4X也让游戏帧率提升了230%~620%,DLSS 4下的平均性能达到了原生帧率的3.3~7.2倍。

1080p分辨率下的跨代次DLSS性能对比测试结果也基本相仿,在开启DLSS 4 4X之后,RTX 5070相比只能开启DLSS 3的RTX 4070在性能上领先程度达到了85%~110%,平均性能领先95%以上。而相比原生帧率状态,RTX 5070在开启DLSS 4 4X之后,帧率的提升程度更是达到了260%~580%的夸张程度。

最后我们还选择了四款DLSS 4游戏进行了DLSS 4 4X在不同挡位DLSS超分辨率模式下的性能增幅表现。从测试结果来看,1440p分辨率下不同挡位下的DLSS 4X都能达到相对原生帧率3.8倍到10倍不等的性能,而开启DLSS 4 4X模式之后,相对同挡位的DLSS 3,性能领先则达到了70%~90%。如下图所示,供大家参考。

游戏性能表现

来看传统的游戏性能表现。在这部分的测试中我们用了21款目前比较热门的游戏进行了详细测试。测试主要在1440p分辨率下集中进行,详细对比了RTX 5070 Ti和RTX 4070的性能。同时,我们也加入了4K和1080p两个分辨率下的参考测试成绩,看看RTX 5070在4K分辨率下可否一战,以及在1080p分辨率下能达到多流畅的游戏运行情况。需要特别说明的是,为了直观对比游戏性能,测试游戏中的DLSS 4游戏在本部分测试中都不开启DLSS 4,而是在支持DLSS帧生成的游戏中与RTX 4070一样仅开启DLSS 3。因此图表中的DLSS ON代表开启DLSS 2或DLSS 3(如果游戏支持DLSS帧生成)。关于DLSS 4的性能测试请参考前文。

测试统一开启游戏的最高画质和最高光追效果,在支持路径追踪的5款游戏中开启路径追踪光追效果。

首先看1440p分辨率,可以看到在DLSS关闭的原生帧率状态下,RTX 5070 FE在游戏性能上领先RTX 4070为9%~37%,平均领先RTX 4070约为19%。开启DLSS平衡模式之后,RTX 5070 FE平均游戏性能领先RTX 4070为18%左右。同比RTX 5070 Ti,在1440p分辨率下,RTX 5070 FE整体性能平均落后前者约为23%。

再来看4K分辨率下RTX 5070的表现。可以看到在原生帧率状态下,RTX 5070 FE确实不能在绝大多数光追游戏中保持60fps的流畅运行帧率,尤其是在5款路径追踪游戏中更是非常乏力。不过在开启DLSS平衡模式之后,可以看到RTX 5070 FE还是能够在几乎所有游戏中都保证60fps+的流畅运行效果的。这表明在DLSS的助推下,RTX 5070在4K全特效的极致设置下,仍然具备了一定的战力,可玩性还是非常不错的。

对比RTX 4070来看,4K分辨率下RTX 5070在DLSS关闭的原生帧率状态下领先前者接近25%,而在DLSS开启时性能领先为20%左右。

1080p分辨率下,RTX 5070已经能够在原生帧率状态下流畅驾驭几乎所有参测游戏,开启DLSS平衡模式之后更是能达到120fps+的绝对流畅运行效果。

对比RTX 4070来看,DLSS关闭和开启两种状态下,RTX 5070的性能领先幅度分别为23%和20%,平均性能领先约21%。

设计创作性能评估

在设计创作性能上,除了规格上的缩减之外,相比RTX 5070 Ti来说,RTX 5070还减少了一个第九代NVENC编码器。从测试结果来看,相比RTX 5070 Ti,RTX 5070的视频编解码落后约25%。不过相比RTX 4070,RTX 5070则有约28%的性能领先幅度。在编解码器配置数量一致的前提下性能领先幅度达到了近30%,说明Blackwell架构的第九代NVENC和第六代NVDEC性能相比前一代已经是遥遥领先。在Blackwell架构支持的4:2:2视频硬件编解码的测试中,相比Voukoder软件编解码方式,RTX 5070的4:2:2视频硬件编解码性能可以达到软件方式的3~9倍。

在3D渲染性能的Blender Opendata Benchamrk测试中,RTX 5070综合性能相比RTX 5070 Ti落后约18%,但相比RTX 4070的领先幅度则达到了22%,尤其是在Junkshop大模型渲染上,性能领先更是达到了30%以上。在V-Ray 6 Benchmark测试中,RTX 5070更是相比RTX 4070达到了40%以上的性能领先幅度。

同为测试3D渲染能力的D5渲染器测试中,和之前的测试一样,我们仍然使用了复杂光追场景“日式花园”和相对简单一点的场景“下雨的庭院”进行实时交互渲染帧率的测试。

从测试结果来看,在不开启DLSS时,原生帧率渲染下,RTX 5070相比RTX 4070在性能表现上平均约有18%的领先幅度,通过DLSS优设模式开启DLSS 4 4X之后,RTX 5070的实时渲染帧率表现相比开启DLSS 3的RTX 4070则达到了90%~110%的巨大领先幅度,DLSS 4的威力在3D渲染设计创作领域同样彰显无遗。相比RTX 5070 Ti来说,RTX 5070在整体实时渲染帧率上落后前者约25%。

AI性能测试

在AI性能测试部分,仍然是从AIGC文生图性能和AI文本推理生成性能这两个方面对RTX 5070进行考核。

首先是基于UL Procyon AI Image Generation的AIGC文生图性能测试。这部分测试结果显示RTX 5070在AIGC性能表现上相比RTX 4070的平均性能领先约为18%,而相对RTX 5070 Ti平均性能落后约为22%。

再来看AI文本推理生成性能测试,这部分测试主要通过ML Perf和UL Procyon AI TEXT Generation进行。关于测试项目的介绍,在之前的评测文章中我们已经进行过详细解析,在这里就不赘述了。

与先期发布的RTX 5070 Ti相比,RTX 5070在整体AI文本推理计算的性能上落后约23%。与RTX 4070相比,RTX 5070在文本单元(词元)输出速度上领先约13%,在第一文本响应时间上领先20%以上。这也说明进化的Balckwell CUDA架构在AI文本推理计算上拥有更大的优势。

AI性能测试最后算是个体验吧,我们用LM Studio+Deepseek R1 8B量化模型进行了简单的体验测试(该测试结果仅供参考)。测试结果显示,在文本单元(词元)输出速度(Tokens/s,每秒词元输出数)上,RTX 5070 Ti性能领先RTX 5070约12%,而RTX 5070性能领先RTX 4070约15%。

温度与功耗

作为一款250W TDP设计的双槽卡,RTX 5070 FE本身在架构上做得十分精巧与细致,而且保持了非常优秀的轻薄性。那么在这种结构设计下,RTX 5070 FE的功耗与散热表现会如何?

RTX 5070 FE在原生帧率状态下进行4K游戏时平均功耗约为229W,开启DLSS之后平均4K游戏功耗为224W,低于TDP设计的250W,说明RTX 5070在能耗比控制上还是比较到位。满载烤机功耗为249W,基本达到了TDP的设计规范。

在散热性能方面,由于RTX 5070 FE的板型纤细轻巧,又是双槽卡且为SFF-Ready的设计,因此综合来看在散热性能上的表现算是及格,并不特别出彩。在Furmark满载烤机15分钟后,GPU核心温度控制在75℃左右。

NVIDIA GeForce RTX 5070 Founders Edition赏析

从外观上来看,RTX 5070 FE完全就是一个迷你版的RTX 5080 FE。第一印象,它依然如RTX 5080 FE一样,迷人且令人沉醉其精巧设计不能自拔。

在包装设计上,RTX 5070 FE同样遵循了100%的环保理念,和RTX 5080 FE一样的环保外纸箱和内盒,与当前社会对环保问题的高度关注相契合。同样,包装的简洁性使得显卡的取用变得异常便捷。

在尺寸上,RTX 5070 FE从RTX 5080 FE的304mm×137mm双槽卡变为了242mm×112mm的双槽卡,整体板型小了一圈,也显得更加精致。而在外观设计上则完全延续了RTX 5080 FE的风格,精细和圆润化的打磨,尤其是在棱角部分打磨得更加细致,并移除了正面的散热片设计全部后置,让RTX 5070整体和RTX 5080 FE一样呈现出了珠圆玉润之风,而且小巧的身材让它更有“小家碧玉”的味道。相比诸多“五大三粗”的三槽非公版RTX 5070显卡,坦白讲我对RTX 5070 FE的喜爱是狂热且毫无道理的。

▲和RTX 5080 FE一样的正面双风扇设计,散热片全部后置。

▲RTX 5070 FE取消了RTX 5080的白色GeForce Logo LED灯效以及X装饰条灯效,整体非常素雅娴静。

▲接口是12VHPWR的改进版——12V-2×6接口,采用了隐藏式的斜插设计。

▲视频输出部分则是3×DP2.1b+1×HDMI 2.1b的组合。

立足1440p战4K,RTX 4070的合格上位替代

“国际惯例”,先说结果:

1. RTX 5070在原生游戏性能上领先RTX 4070约在17%~20%,4K分辨率下高一点,1440p分辨率和1080p分辨率下低一点,这个程度的性能领先算是中规中矩的前后代性能替代。当然对于之前对RTX 5070期望值非常高的玩家来说,可能会觉得这个性能领先幅度略微“小气”了一点,不过我们认为这个程度的性能表现还算是在合理范围内,毕竟价格决定细分市场。

2. DLSS 4仍然赋予了RTX 5070巨大的能量,在DLSS 4的加持下,RTX 5070的性能可以领先RTX 4070达到80%甚至翻倍的程度,这也极大地增加了RTX 5070的迭代更新价值。

3. 在AI性能和设计创作性能的表现上,RTX 5070相比RTX 4070的优势更大一些。在AI性能上可以达到25%左右的领先,在3D渲染性能上甚至部分测试达到了超过40%的性能领先。

简单总结一下,RTX 5070的原生游戏性能或许与不少玩家的预期有些出入,17%~20%的性能领先幅度虽然不能说特别出彩,但作为一款甜点级定位的产品,我们认为还算是合格的。目前NVIDIA对RTX 5070显卡给出的首发指导价格是4599元,低于当初RTX 4070首发时的4799元,某种意义上来说也算是“加量又减价”。再加上DLSS 4这一黑科技的超级加持,让RTX 5070相比RTX 4070拥有了更大的优势。对那些尚在使用RTX 4070甚至是RTX 3070这种“老甜点”显卡的玩家来说,拥有新技术、新特性且性能、功能都明显领先的RTX 5070肯定是拥抱新科技的更好选择。合适的价格、不错性能、领先的黑科技……如果想要在甜点级的定位上拥抱Blackwell,那么GeForce RTX 5070无疑就是当前最好且最具性价比的选择。尤其是如果想要打造一台基于RTX 5070这种档次显卡性能的游戏或设计创作小钢炮,那么纤细优雅的RTX 5070 FE更是不可多得的好选择。

0 阅读:0

微型计算机

简介:以“MC评测室”为基础提供各种科技和IT产品评测资讯