过去一年,英伟达用RTX 40系显卡与CUDA生态的双重攻势,再次定义了GPU行业的游戏规则——RTX 4090 D以碾压级算力坐实「卡皇」地位,RTX 4080 SUPER则凭借「甜品级」定价与DLSS 3的AI魔法,成为4K玩家的性价比首选。据Steam硬件调查,40系显卡用户占比半年内暴涨300%,而《赛博朋克2077》《心灵杀手2》等光线路径追踪大作的火爆,更是将英伟达的「光追霸权」推向新高。而代表中国原创游戏产业能力的《黑神话悟空》发布之后,GPU对游戏的决定性作用,被推高到了匪夷所思的程度,无论是玩家市场还是资本市场,都产生了GPU信仰。
而在游戏生态之外,英伟达的触角已深入AI革命的每个角落:Flux的实时生图、本地部署的大语言模型、Blender的OptiX渲染加速……AI场景的爆发,让GPU从「游戏硬件」进化为「生产力核心」。然而,当玩家为《黑神话:悟空》的4K光追欢呼,开发者因AI算力需求被迫「军备竞赛」时,一个尖锐的问题浮现:面对摩尔定律的失效与显存带宽的瓶颈,显卡的下一站究竟是堆料,还是算法革命?这个问题的矛盾性,在最近的资本市场彻底爆发,无论是玩家还是推理侧落地场景的运营者,都需要一个清晰的答案,当然,我想英伟达和OpenAi也需要这个答案。
今天,GeForce RTX 5080的登场,恰是英伟达交出的阶段性答案:继承40系的DLSS3与光追生态,用Blackwell架构的效能跃升、30 GHz GDDR7的带宽红利,以及DLSS 4的「多帧生成」,试图在8299元的定价下,同时满足玩家对「性能越级」与「战未来」的期待。但争议随之而来:友商还在追赶光追时,老黄已用AI帧生成技术「改写物理定律」,这是技术进步,还是对硬件瓶颈的妥协?这场评测,从DLSS 4的「多帧生成魔法」开始拆解。

我们做了个图,展现GeForce这些年来80次旗舰和80 Ti/90旗舰的FP32性能变化趋势,RTX 30系之前80基本有同代70%以上的规模和性能,并且基本上新一代的80性能都要优于上一代的旗舰。以RTX 3080为例,采用和RTX 3090相同的GA102核心,有RTX 3090 80%以上的性能。仅有一次例外就是RTX 2080相比GTX 1080 Ti,这代工艺不仅没有明显变化,并且加了大量的RT Core和Tensor Core,使得RTX 2080的FP32没能超过GTX 1080 Ti,但即使如此RTX 2080的GPU的规模也还是更大的。
到了RTX 40系80和90的差距就开始拉开,RTX 4080的流处理器规模只有RTX 4090的60%,但得益于TSMC定制4N在工艺上吃了2代红利,使得RTX 4080还是得以全面碾压RTX 3090,甚至再低两级的RTX 4070 Ti都叫板RTX 3090 Ti的实力。

再来看看RTX 5080的规格,RTX 5080和RTX 4080 SUPER相比一样是7个GPC,但应该和ADA一样,一个GPC是6个TPC和12个SM,而不是RTX 5090 D的8个TPC和16个SM。这样7个满规格GPC刚好是84个SM,因此RTX 5080就是GB203的满规格。

RTX 5080 SM数量比RTX 4080 SUPER多5%,与SM绑定的流处理器数量/纹理单元和Tensor Core也是多5%,考虑Bosst频率的提高就是7.75%的提升幅度,ROP是同GPC绑定,依然维持112个。
RTX 5080这次升级幅度最大的显存系统,虽然还是维持256 Bit位宽,但采用频率高达30 GHz的GDDR7,这样相比RTX 4080 SUPER的256 Bit 23 GHz的GDDR6X频率和带宽提升了30%。每个SM平均带宽高达11.43 GB/S,比RTX 5090 D还高。之前我测试RTX 5080 SUPER单独将显存从23 GHz超频到25 GHz,3DMARK Speed Way性能就有4%提升,这说明之前的显存带宽还是有比较明显的瓶颈。
但RTX 5080 10752个流处理器规模只比RTX 4080 SUPER多5%,只有RTX 4090的2/3,在频率差不多的情况下,RTX 5080大概的性能级别还是很明显的,最大的变量就是30 GHz的GDDR7会给性能带来多大的变化。
GeForce RTX 5080 FE:显卡中的当代赛博艺术品
我们本次首发测试RTX 5080是NVIDIA送测的RTX 5080 Founder Edition,其十分性格的固定在环保牛皮纸盒里。整体还是延续之前FE的工业设计风格,采用一个8字型金属中框,中间黑色栅格为散热片,但在塑料件边角过渡处理上更为圆润。

不到30cm RTX 5080 FE的相比AIC那些动辄36cm+怪兽相比就十分的小巧可爱,并且卡厚也被控制在2槽,整体尺寸远小于NVIDIA的SFF-Ready规范的要求。

顶部的16pin接口为斜插布置,虽然这样走线比较难得好看,但空间兼容性更好。右侧的GEFORCE RTX的Logo在通电的时候有白色背光,低调的点缀恰到好处。

正面依然是两个大尺寸的切边轴流风扇,X型中框延展到侧面边缘到边缘,金属件并不是银白而是呈现偏黄一点的古铜色泽。

由于RTX 5080 FE不厚很容易吹透,所以其鳍片密度可以做的很密,但我们还是可以从鳍片缝隙中隐约看见5跟粗大的热管,中间的GPU和显存区域由VC均热板覆盖。不过RTX 5080 FE的VC和热管依然是传统的焊接工艺结合,而非RTX 5090 FE那样的热管和VC连通的3DVC。

虽然看上去差不多,但RTX 5080 FE的散热结构还是有很大的变化,从这张图我们可以发现两边风扇都可以直接对穿吹透。

30/40系的FE前部风扇可以吹透,但后部风扇气流只能同尾部排出,而RTX 5080 FE将PCB的集成度提高,压缩在中间一小块区域,再通过转接连接PCIe和显示信号输出,这样前后两个风扇就可以直接对穿吹透。

这样甚至后挡板就可以直接封住。接口部分依然还是为3 DP+1 HDMI,DP升级为满血UHBR20 80 Gbps的DP 2.1。
无论从结构还是审美上,NVIDIA已经为各家AIC做了表率,我也希望各家AIC能够好好学习。
测试平台和说明
虽然本次测试绝大部分测试项目都是完全的GPU瓶颈,但本次测试平台依然为目前游戏王者AMD Ryzen 9800X3D(似乎这个赛季全球顶尖的评测媒体全部倒向了AMD),测试内存使用的是DDR5 32GB x 2 6400 FCLK同步。 具体参数为6400 32-42-42-58,均设置为tREFI=65535/FCLK=2200。测试显卡在没有特别说明的情况下均使用NVIDIA公版标准频率和功耗限制。
3DMARK性能/功耗和温度虽然3DMark并不能完全代表游戏性能,但其负载更稳定,合适一些细节特性分析。

Timespy Extrame是纯粹的DX12光栅化测试,而Port Royal和Speed Way都是光线追踪测试,但Speed Way对于带宽更为敏感。这三个4K项目RTX 5080相比RTX 4080 SUPER分别提升了32%/25.3%和23.7%,从而可以达成RTX 4090 D的90.8%/92.6%和92.8%性能。RTX 5080性能必然在RTX 4080 SUPER和RTX 4090 D之间,但相对更为接近RTX 4090 D还是略微高出我们预料。

我们使用Speed Way压力测试20轮来测试RTX 5080 FE的频率稳定性,RTX 5080 FE的Boost频率为2617 MHz,实际测试频率基本可以稳定在2750 MHz以上,但其还是被360 W的Power Limit限制,频率的波动范围较大,不过RTX 5080 FE可以拉高到108% 390W,因此还是有比较大的超频空间。至于RTX 5080的超频的表现如何,可以看看我们另外一篇对于iGame GeForce RTX 5080 Vulcan OC 16GB的测试。

另外GPU-Z可以读出5080 FE的显存功耗,16GB 30 GHz GDDR7功耗在50W水平,而核心在300W,加起来同360W的TGP基本相符,那这个GDDR7的功耗读数应该是靠谱的,16GB 30 GHz GDR7相比RTX 4080 SUPER 23 GHz 16 GB GDDR6X 60W的功耗更低,那RTX 5090 D的32GB更低频率的28 GHz GDDR7功耗就应该在100W以下。

在25度的环境温度,将RTX 5080 FE TGP拉倒375W的条件下,Speed Way压力测试20轮,核心最高温度75度,风扇转速在16xx RPM,这个温度虽然不能跟AIC旗舰6x度 13xx RM转速比,但也没什么问题。不过RTX 5080 FE的GDDR7显存温度高达88度,这就有点偏高了,看了下之前RTX 5090 FE的Tear Down,显存并没有被VC覆盖,估计RTX 5080 FE也差不多。

RTX 5080 FE的背板中间三角区域的PCB温度较高,上下被塑料件覆盖。整体而言,RTX 5080 FE虽然温度比AIC的三风扇+三槽温度更高,但散热性能也是足够的,并不会撞温度墙导致性能下降。不过我个人并不是ITX爱好者,还是跟希望把这个设计加厚到3槽,换取更低的温度和风扇转速。
游戏性能测试游戏性能测试我们主要测试的是4K分辨率和4K DLSS质量和性能模式,4K DLSS质量和性能模式其实基本就等效于2K原生分辨率和2K的DLSS性能,因此性能2K分辨率用户也可以参考。另外在本次测试中我们也对支持的游戏加入了DLSS 4.0的2X帧生成和4X多帧生成测试。
赛博朋克2077赛博朋克2077 在2.1更新了对DLSS 4的支持,本次测试设置4K分辨率/游戏最高画质/DLSS 4,使用游戏自带Benchmark进行测试。

赛博朋克2077在开启DLSS 4 Transformer超分后会提供更好的画质,特别是更好的动态画质,光线重建的质量也有明显的提升,但Transformer相比CNN大概有5%的性能损失。在不开启帧生成的情况下,RTX 5080在DLSS性能模式可以达成60 FPS可玩性能。
DLSS 4新的FG实现性能相比DLSS 3更高,性能提升幅度可以从60%增长到80%。而在开启FG和MFG 4X之后,RTX 5080性能更是可以提高到105和185 FPS。
星球大战:亡命之徒星球大战:亡命之徒虽然和阿凡达潘多拉边境一样使用雪莲花引擎,不仅增加了对于光线追踪的支持,还支持路径追踪。测试使用最高画质(包括高级图像设置),使用FrameView记录第一关城镇内固定路线30秒的性能。

星球大战:亡命之徒也增加了对于DLSS 4的支持,RTX 5080在开启2X帧生成和4X多帧生成后,在DLSS 4性能模式分别可以达成90和160 FPS以上的性能,可以满足4K高刷的需要。
心灵杀手2心灵杀手2和赛博朋克2077一样,提供了路径追踪和光线重构功能。心灵杀手2我们使用回归/邀请任务的城镇街道作为测试场景,游戏设置全特效,使用FrameView记录60秒性能数据。

RTX 5080在4K DLSS性能模式就有69 FPS的可用性能,在开启FG和MFG后更是可以达成117和202 FPS,满足4K高刷显示器的性能需求。这个项目1% LOW帧数偏度的原因是测试场景前端的过场动画帧数偏低,拉低了1% LOW的帧率。
夺宝骑兵:古老之圈夺宝骑兵:古老之圈使用Vulkan的id Tech 7引擎,并且支持路径追踪,测试使用全最高画质,使用FrameView记录黄金神像关卡进入血色神庙雨林场景30秒的性能。

夺宝骑兵:古老之圈显存占用十分的高,在4K DLAA的设置16GB的RTX 4080 SUPER和RTX 5080甚至不能稳定工作而会闪退,而4K DLSS性能也会直接吃满16GB,并且RTX 5080依然还是不能达成60 FPS的基本流畅要求。

而开启DLSS 3帧生成还需要占用额外的显存,显存容量不足会导致RTX 4080 SUPER和RTX 5080的帧生成失效,需要降低到DLSS超高性能,也就是720P的分辨率帧生成才能正常工作。
不过我还是要再强调一点,尽管夺宝奇兵会把RTX 5080的16GB给爆掉,但对于游戏玩家而言RTX 5080的16GB显存容量依然是合适的,这情况是属于特例。正常情况一个游戏如果16GB的显存容量不够用了,那RTX 5080核心性能早就被爆掉了,有再大显存也没用。并且夺宝奇兵后续在升级DLSS 4后,采用新的帧生成和多帧生成算法降低显存容量需求,RTX 5080就应该就可以有不错的体验。
地铁离去增强版地铁离去增强版是唯一仅支持光线追踪的3A游戏,这样场景设计的时候可以简化一些预烘培和光源设置。我们使用Extreme画面并手动开始Hairworks和高级PhysX,使用游戏自带benchmark进行测试。

地铁离去增强版RTX 5080相较RTX 4080 SUPER提升幅度大概在8+%,并不算大。分析原因地铁离去增强版虽然很吃GPU,但不吃带宽,RTX 5080 GDDR7带宽提升的收益就不大,现在8+%性能提升幅度就十分接近于规模 x 频率的提升幅度。
黑神话悟空黑神话悟空使用的是虚幻5引擎,并且在UE5的基础上重新构建了一套基于路径再采样的实时路径追踪的光照系统,相比UE5原生的Lumen实现效果更好,并且还有不错的执行效率。黑神话悟空使用全最高特效进行测试。

RTX 5080在DLAA和DLSS质量相对RTX 4080 SUPER有差不多20%水平的提升,而在DLSS性能模式,GDDR7带宽优势就被削弱,在4K全特效下,RTX 5080在开启帧生成后,也有87 FPS这样不错的性能。
地狱之刃2:塞娜的传说地狱之刃2:塞娜的传说是第一个采用虚幻5引擎的3A游戏,其使用的是UE5自带的Lumen光照系统,而没有附加额外的RTX特性,但其Nanite的运用相比黑神话更为充分。地狱之刃2测试除了开启VRS,其他均为最高特效。

地狱之刃2是个重带宽的游戏,在DLAA和DLSS质量相对RTX 4080 SUPER有差不多15%水平的提升,当然在DLSS性能模式优势下降到12%,与同为UE5的黑神话比较类似,但其仅有Lumen光照系统,在光追性能的敏感度上是低于路径追踪的黑神话的。
诛仙世界完美用虚幻5引擎开发的经典IP开放式世界MMORPG,不过其应该没有用UE5 Nanite/虚拟纹理技术,光照系统也直接使用的Lumen,没有额外的RTX特性。

RTX 5080在诛仙世界相对于RTX 4080 SUPER有14%的领先幅度,在4K TAA设置就有64 FPS可用性能,但在开启DLSS后性能提升幅度偏小,整体的性能负载是明显低于同为UE5的地狱之刃2和黑神话悟空的。
F1 2024F1 2024我们使用最高图像设置,测试场景选择中国,为了加大负载天气设置未雨天。

RTX 5080在DLAA和DLSS质量相对RTX 4080 SUPER有接近20%提升,DLSS性能也有15%,F1 24对于GPU和CPU优化都很不错,可以比较充分的利用资源。
极限竞速极限竞速是Forza正统系列的第8作,相比地平线系列其拟真度和专业性更高,测试我们设置未最高画质,使用游戏自带Benchmark进行测试。

RTX 5080相对RTX 4080 SUPER在三个分辨率都差不多有15%性能提升,特别是DLSS性能模式还不至于出现RTX 5090 D那样明显的CPU性能瓶颈。
阿凡达潘多拉边境Massive使用雪莲花引擎做的同名电影IP游戏,阿凡达潘多拉边境虽然支持光线追踪,但走是RTGI方式,设置超高画质使用游戏自带benchmark进行测试。

阿凡达的负载相比同为雪莲花的星球大战:亡命之徒要低不少,所以RTX 5080的性能提升幅度也较小,大概在8-13%范围。
荒野大镖客救赎2荒野大镖客救赎2虽然还是上个十年的游戏,但其现在依然是光栅化游戏的画面巅峰。测试我们设置使用Vulkan渲染路径的最高特效(包括高级图形设置),使用游戏自带的Benchmark进行测试。

RTX 5080在荒野大镖客救赎2中相对RTX 4080 SUPER TAA/DLSS质量和DLSS性能的提升幅度只有10%/9%/8%,但终究也大于规模和频率的提升幅度,也在预期范围。
刺客信条幻境刺客信条幻境从其售价上就可以发现其并不是个全价的3A,而更多是利用英灵殿资产复用次级项目,游戏场景规模要小于之前的神话三部曲。

和之前RTX 5090 D测试一样,相对轻量的刺客信条幻境并不能给RTX 5080带来足够的负载,因此性能提升幅度比较小,TAA/DLSS质量和DLSS性能的提升幅度只有8%/5%/3%,因此我现在还是很期待次世代画面表现大幅提升刺客信条暗影的。
游戏性能小结
RTX 5080相比RTX 4080 SUPER在原生4K和DLSS质量模式平均有15%的性能优势,对于重度高硬件需求的游戏性能优势可以到20%的水平,高系统需求的游戏往往也比较吃显存带宽,RTX 5080的GDDR7带宽优势就可以充分的发挥,而对于光栅化的游戏性能差距则缩小到10%甚至以下。而开启帧生成 RTX 5080也有14.5%的性能游戏,DLSS 3也会增加对显存容量和带宽的需求。

至于RTX 5080和RTX 5090 D的性能比较,整体而言RTX 5080用RTX 5090 D一半的晶体管规模实现了2/3的性能。当然这个具体比值还是同游戏的负载相关,负载越高差距也就越大,对于要求比较低的传统光栅化游戏RTX 5080可以有RTX 5090 D的70%以上的性能。
AI性能测试MLPerf性能测试MLPerf是基准测试由来自学术界、研究实验室和行业的 AI 领导者联盟 MLCommons 开发,旨在对硬件、软件和服务的训练和推理性能进行无偏评估测试程序。

在MLPerf测试中, RTX 5080的性能比RTX 4080 SUPER快16.7%,是RTX 5090 D性能的63.6%。推理是相对吃显存带宽的,因此RTX 4080 SUPRE到RTX 5080性能提升幅度是要大于规模 x 频率的提升的增幅。
Procyon文字内容生成测试
我们依然使用Procyon进行文字内容生成测试,这个测试会调用四个不同类别和大小的模型进行推理,4个模型RTX 5080 D相比RTX 4080 SUPER推理性能分别有9.2%/18.1%/23%和27%的提升,整体也比较接近RTX 4090 D的性能水平。
Procyon Flux文生图测试目前ComfyUI+Flux还不能支持RTX 50系平台,因此Flux文生图测试依然采用UL的Procyon进行,分别测试各个GPU的Flux Dev的FP8和FP4性能。

FP 8 RTX 5080相比RTX 4080 SUPER性能提升11%,但在使用FP4后,RTX 5080性能提升64.5%,并且超越了RTX 4090的FP8性能。
视频编码能力测试
RTX 5080虽然没有RTX 5090 D三编码器,但也配备了第九代的双编码器,并提供了对H265/H264 4:2:2编码格式的硬件编码支持。

RTX 5080虽然和上代RTX 4080/4090一样是双编码器,但对于H265/AV1 4:2:0编码性能也有70%的提升,并且=RTX 5080的双编码器和RTX 5090 D的三编码器性能差距并不太大。
Blender渲染性能测试这部分测试我们使用最新版的Blender 4.3分别使用Optix和CUDA渲染输出一张1920 x 1080家装图,输出结果为渲染完成秒数,越短越好。

在CUDA和Optix路径,RTX 5080相对于RTX 4080 SUPER分别有10和15%的性能提升,由于RTX 50系在RT Core光线追踪方面提升较大,因此其在需要调用RT Core的OptiX路径有更大的性能提升幅度。
终章:帧生成革命、AI霸权与游戏产业的未来帧生成技术的史诗性意义——从“硅基极限”到“算法自由” 自DLSS 1.0以超分辨率技术初露锋芒,到DLSS 4的“动态超分+多帧生成”双剑合璧,NVIDIA用五年时间完成了一场游戏渲染范式的颠覆。帧生成技术的核心,在于它打破了“硬件算力决定帧率”的铁律,转而通过AI预测与插值,在像素级重构画面逻辑。这一突破,堪比图形学从光栅化到光线追踪的跃迁——它不再依赖晶体管堆砌,而是以算法为杠杆,撬动算力的指数级释放。《赛博朋克2077》中,DLSS 4将路径追踪帧率从60推至185 FPS;《黑神话:悟空》借AI插帧实现“细节零损耗”的超分辨率渲染。这些案例证明:当游戏画面逼近真实世界的物理复杂度时,唯有AI能跨越硬件鸿沟。DLSS的前景:从游戏到“数字宇宙”的基础设施 显而易见,DLSS的野心远不止于游戏。随着英伟达Omniverse的扩张,DLSS的底层架构——基于Tensor Core的实时超分与帧生成,正在成为虚拟世界的基础渲染标准。而英伟达的布局已显露端倪:Blackwell架构中暴增的AI算力、CUDA生态对开发者工具的全面开源、与微软/Unity/Epic的深度绑定……DLSS终将跳出游戏,成为3D内容产业的“水电煤”。近期英伟达备受挑战,但DLSS和CUDA依然是坚固的护城河 最近一年英伟达备受追捧的核心逻辑在于——AI训练与推理的算力需求呈指数级增长,而CUDA生态构筑的护城河无人能破。虽然最近算力基础设施投入的必要性和产能的稀缺性备受挑战。但如果我们换个视角,DLSS是英伟达护城河的“无敌侧翼”:它让消费级GPU成为AI技术的试验场,反哺数据中心需求。有分析报告指出,“游戏GPU是英伟达向开发者普及AI工具的关键入口”。当玩家为DLSS 4的帧率买单时,他们也在无形中为PyTorch、TensorFlow的开发者生态输血。AI技术革命将重写社会运行规则,英伟达依然手握“画笔” 通过过去几年的技术演进,单就游戏和内容行业来说,还将有两场革命:创作革命:AI生成关卡、NPC行为、剧情分支,甚至实时渲染电影级画面,开发成本与门槛断崖式下降体验革命:路径追踪成为基础,120Hz光追常态化,VR/AR与脑机接口催生全新交互形态。这些应用前景,均需海量算力与高效算法支撑。而英伟达的GPU+DLSS+CUDA组合,依然是唯一能同时提供“工具链+算力池+开发者生态”的解决方案提供者。若说过去游戏行业是“创意驱动”,未来将是“算力与算法驱动”。从这个角度来说,我们没有理由不看好英伟达的前途。而且我相信,道理是越辩越明的,目前行业所有的争议和创新,都有助于游戏和AI产业去伪存真,摆脱重复的基础建设投资和错误的方法论,越强的大模型和解决方案,将有助英伟达精进这套GPU+DLSS+CUDA的组合武器。
所以回到现实话题:RTX 5080,谁该入场?谁该观望?
RTX 5080是一张“过渡卡”,却昭示着一个新时代:游戏显卡不再只是“娱乐工具”,而是AI革命的终端触手。当资本市场为英伟达的万亿美元估值欢呼时,玩家也在用真金白银投票,认可“算法优先”的未来。
或许某天,人们会像谈论“内燃机到电动机”一样,回顾DLSS如何终结了“堆料时代”。而彼时,游戏将不再是“硬件性能的囚徒”,而是AI与人类想象力共舞的舞台。
最终抉择:若你相信技术革命的价值,RTX 5080就是通往未来的船票;若你执着于传统硬件逻辑,它也可能成为“变革阵痛”的注脚。答案,只在你的选择之间。
从之前天玑9400的测试就可以很清楚的知道台积电N3E不说功耗,性能也是有很大提升的。但现在摩尔定律已死,现在工艺的提升并不能带来相同晶体管规模价格的下降,这就是显卡越来越贵的核心原因,如果GPU上N3E显卡就只会更为高昂,远远超出消费级用户承受能力。
在现在的节点条件下,GPU提升只能扩大规模和优化架构。RTX 5090 D相比RTX 4090至少还扩大了20%的规模,而RTX 5080甚至是连规模都没怎么扩大,晶体管数量和核心面积都维持在RTX 4080 SUPER的水平,但仅仅是依靠架构优化和优化改进拉高频率而实现了差不多15%的性能提升。
我之前就说过,GPU的竞争合适是架构效能的竞争,谁能够在架构效能上领先就可以在相同成本做出更高的性能,相同性能只需要更低的成本,而现在Blackwell就实现了架构效能上的进步,再加上全新算法的DLSS 4,实现之前根本无法想象的性能。
RTX 5080的流处理器规模还不到RTX 5090 D的一半,显存容量位宽也是RTX 5090 D的一半, 378mm2的Die size也只有RTX 5090 D一半,这应该是历史上80同90/80 Ti规格差距最大的一代。当然RTX 5080 8299的MSRP也只有RTX 5090 D的一半,并且由于边际效应RTX 5080还是有RTX 5090 D的2/3性能,单纯说性价比RTX 5080也还是比RTX 5090 D更高。

作为玩家,需要考虑的是自己的需求,并不是每个人都是富哥都是90起步,RTX 5080也能够很好满足大部分玩家的需求。而说其需求,显卡的经典需求就是游戏驱动,去年本来是个游戏小年,但有黑神话悟空的横空出世大大的拉动了GPU的销售。而今年已知的顶级大作就是GTA6和巫师4,而稍早CDPR在TGA上公布的首部巫师4宣传片就是使用RTX 50系渲染。游戏发售箭在弦上,那你的50系显卡准备好了吗?显卡这个东西最近几年也基本是早买早享受,晚买也没折扣。