在显卡的激烈竞争市场中,MSI GeForce RTX5090 Suprim SOC凭借其卓越的性能和独特设计脱颖而出。这款显卡基于全新的RTX5090 Blackwell旗舰GPU打造,是微星最顶级的风冷定制显卡,目标是在4K超高清分辨率下畅玩所有当前及未来游戏,甚至能解锁8K 60Hz或120Hz的全新游戏体验。今天,就让我们一同深入了解这款显卡的魅力所在。
GeForce Blackwell架构作为NVIDIA RTX技术的第四代革新成果,延续并深化了实时光线追踪与传统光栅化3D图形融合的理念。它带来的神经渲染技术,是图形处理领域的一大突破。与DLSS基于训练数据、时间帧和运动向量在放大帧中重建细节不同,神经渲染赋予GPU借助生成式AI创建部分画面帧的能力,开启了图形渲染的新篇章。
我们评测的MSI RTX5090 Suprim SOC,其核心是采用5nm工艺的GB202芯片。这款芯片堪称NVIDIA的“巨无霸”,面积达到750mm²,相比AD102芯片的608.5mm²更大,容纳了多达922亿个晶体管,比AD102增加了20%。尽管两代芯片都基于台积电4N(NVIDIA定制的5nmEUV变体)工艺,但GB202的性能提升并非依赖工艺升级,而是架构优化的成果。
GB202芯片在组件布局上继承了NVIDIA GPU的传统层级结构,但也有不少令人瞩目的改进。它率先在游戏GPU中支持PCI-Express5.0 x16,这意味着它能与自英特尔12代酷睿“Alder Lake”和AMD锐龙7000“Zen4”发布后众多支持PCIe Gen5的系统完美适配,同时向下兼容旧版本PCIe。此外,GB202还是首款采用GDDR7内存标准的GPU,相比GDDR6,GDDR7速度翻倍且带宽能耗更低。RTX5090配备的32GB、28GbpsGDDR7内存,通过512位宽的内存接口,为高性能图形处理提供了充足的数据带宽保障。
Giga Thread引擎负责GB202的主要图形渲染工作负载分配,新加入的AI管理处理器(AMP)则是一大亮点。AMP就像一位智能调度大师,专门管理GPU上的所有AI加速资源。它能让GPU在运行游戏实时图形渲染的同时,高效运行大语言模型(LLM),且两者互不干扰。这一特性对于DLSS4的多帧生成技术至关重要,确保了GPU在复杂的AI和图形任务混合场景下也能稳定高效运行。
每个图形处理集群(GPC)作为GPU的重要细分单元,包含16个流处理器(SM)、8个纹理处理集群(TPC)和一个由16个ROP组成的光栅化引擎。GB202上的SM相较于Ada代有显著升级,每个SM拥有128个CUDA核心,且所有128个SIMD单元都具备并发FP32+INT32处理能力。这些CUDA核心被划分为四个切片,每个切片都配备独立的寄存器文件、L0指令缓存、warp调度器、两组加载存储单元和一个特殊函数单元(SFU),用于处理三角函数、指数、对数、倒数和平方根等特殊数学运算。四个切片共享128KB的L1数据缓存和四个纹理映射单元(TMU)。
值得一提的是,Blackwell SM引入了神经着色器的概念,微软在DirectX12最新更新中通过Cooperative Vectors API为神经着色器标准化奠定了基础,使得Tensor核心可通过神经着色器接入工作负载。Blackwell SM的着色器执行重排序(SER)引擎也能更精准地为CUDA核心和Tensor核心重新排序工作负载,大幅提升处理效率。
5thGen Tensor核心支持FP4数据格式(1/8精度),应用于快速移动的原子工作负载时,其吞吐量是Volta架构初代Tensor核心的32倍。随着AI技术发展,AI模型通过采用更低精度数据格式和稀疏性来提升性能,5thGen Tensor核心的这一特性顺应了这一趋势。
4thGen RT核心同样表现出色,在光线测试和光线相交性能上实现了代际提升,降低了启用路径追踪和光线追踪效果的性能成本。它引入的Mega Geometry技术是一大创举,通过将对象中的三角形簇作为一级基元,并采用簇级加速结构,使光线追踪能够处理极高多边形数量的物体,显著提升物体细节。新的三角形簇相交引擎专门用于处理Mega Geometry,配合三角形簇压缩格式和无损解压引擎,更高效地处理复杂几何图形。
由于GB202与前代Ada架构基于相同的台积电4N工艺节点,NVIDIA在电源管理和散热方面进行了创新。重新设计的电源管理引擎通过对各个GPC和其他顶级组件进行时钟门控、电源门控和轨控,优化了功耗。同时,提升了GPU在功率相关决策上的速度,并引入了在SM级别快速调整时钟速度的技术,实现更灵活的功耗控制。
在显示和媒体引擎方面,Blackwell架构也有显著改进。前代Ada架构因沿用Display Port1.4等旧显示I/O标准而备受诟病,此次Blackwell支持DP2.1 UHBR20,可通过单根线缆实现8K60Hz的视频输出。此外,NVDEC和NVENC也得到升级,支持AV1 UHQ、H.264解码性能翻倍、MV-HEVC以及4:2:2格式,为用户带来更出色的视频处理和显示体验。
MSI延续了GeForce40 Suprim系列的设计风格,MSI GeForce RTX5090 Suprim SOC整体采用金属银色为主色调,搭配灰色点缀,呈现出简洁而大气的科技美感。显卡背部配备了金属背板,背板上精心设计的镂空部分,有效促进了空气流通,不仅增强了散热效果,还为显卡的整体外观增添了一份独特的工业质感。
从尺寸来看,这款显卡的长度为36.0厘米,宽度达15.0厘米,重量约2839克,在安装时需要占用系统中的四个插槽,实测其宽度为75毫米。这样的尺寸规格意味着在装机时,用户需要提前确认机箱内部空间是否足够,以确保显卡能够顺利安装。
在显示连接方面,MSI GeForce RTX5090 Suprim SOC提供了丰富且高性能的接口组合,包括三个标准的DisplayPort2.1b接口和一个HDMI2.1b接口。这一配置符合GeForce RTX50系列Blackwell显卡的标准,其全新的显示引擎支持三个Display Port2.1b输出,每个接口都具备UHBR20的高速传输能力;HDMI2.1a接口同样表现出色,这两种接口均支持显示流压缩(DSC)技术。
借助DSC技术,该显卡的性能得到了极大的发挥。例如,单个Display Port接口就能轻松驱动4K分辨率、12位HDR且刷新率高达480Hz的显示器,或者支持8K分辨率、12位HDR且刷新率最高达165Hz的显示输出。此外,RTX5090配备的更新版媒体加速引擎,对4:2:2视频格式、AV1UHQ以及MV-HEVC等都提供了有力支持,同时还内置了三个独立的NVENC编码单元和两个NV DEC解码单元,为用户在视频处理、高清视频播放等方面带来了更流畅、更优质的体验。
在供电方面,显卡采用了单个16针连接器,这种设计能够满足显卡最高600W的功耗需求,为其稳定运行提供了充足的电力保障。
MSI在显卡的外观细节上也下足了功夫,在风扇附近设置了可调节的RGB灯光区域。显卡上的“Suprim”文字标识以及角落处的Suprim logo在点亮后都会散发迷人的光芒,用户可以通过相关软件对灯光效果进行个性化设置,打造出独一无二的主机氛围。
另外,显卡还配备了双BIOS开关,这一设计为用户提供了更多的选择空间。通过这个开关,用户可以在默认的“静音”BIOS和“游戏”BIOS之间轻松切换。“静音”BIOS模式下,显卡的风扇曲线相对保守,运行时噪音更低,适合对噪音较为敏感的用户;而“游戏”BIOS则采用了更激进的风扇曲线,在游戏等高负载场景下,能够让风扇更快速地运转,从而更有效地降低显卡温度,确保显卡性能的稳定发挥。
对显卡进行拆解后可以发现,其主要散热器承担着为GPU、内存芯片以及VRM电路散热的重要任务。散热器采用了大面积的均热板底座,并搭配了11条热管。这种设计能够迅速将GPU产生的热量传导出去,通过热管高效地分散到整个散热鳍片上,再借助风扇的强劲风力将热量排出机箱外,从而保证显卡在高负载运行时的温度始终处于合理范围内。
金属材质的背板不仅在外观上提升了显卡的质感,更重要的是,它能够在安装和日常使用过程中对显卡起到保护作用,有效防止因碰撞、挤压等造成的损坏,延长了显卡的使用寿命。
从PCB正面可以看到,这款显卡为GPU配备了一套极为强大的22相供电VRM(Voltage Regulator Module,电压调节模块),这些供电模块被标记在上方的红色矩形区域内。整个供电系统由MonolithicPowerSystems公司的MP29816控制器统一管理,确保供电的稳定性和精准性。
值得注意的是,所有GPU供电相位均采用了Monolithic公司的MP87993 DrMOS芯片。虽然目前这款芯片的具体电流额定值尚未完全明确,但从型号中的“9”推测,其额定电流可能达到90A。如此强大的供电配置,能够为高性能的GB202 GPU提供稳定而充足的电力,确保其在高负载运行时性能不受供电瓶颈的限制。
除了GPU供电,为16颗GDDR7显存芯片供电的VRM同样不容忽视。这部分采用了七相供电设计,并且同样由MP29816控制器负责调控。显存供电部分同样选用了MP87993 DrMOS芯片,与GPU供电保持了一致性,这有助于维持显存运行的稳定性,保证数据的高速读写。
这款显卡搭载的GDDR7显存芯片来自三星,型号为K4VAF325ZC-SC28,其数据传输速率高达28Gbps,能够为显卡提供强大的数据带宽支持,满足复杂图形处理和高分辨率游戏对显存的苛刻要求。
位于显卡核心位置的NVIDIA GB202 GPU体积巨大,采用台积电的5纳米“NVIDIA 4N”工艺制造,与Ada架构的GPU采用相同制程。其芯片面积达到750mm²,集成了922亿个晶体管,如此庞大的晶体管数量和先进的制程工艺,为显卡带来了卓越的计算性能和图形处理能力,是这款显卡能够在高端市场占据一席之地的核心硬件基础。
从测试数据来看,MSI RTX5090 Suprim SOC在默认BIOS下,游戏时GPU温度为75°C,显存温度80°C,风扇转速1093RPM,噪音28.4dBA;切换到性能BIOS后,GPU温度降至65°C,显存温度70°C,风扇转速提升至1651RPM,噪音为36.3dBA。与其他竞品相比,该显卡在温度控制和噪音表现上具有一定优势,尤其是在默认BIOS下,噪音控制出色,能为用户带来相对安静的使用环境。
噪音测量使用经过校准的1/2英寸测量麦克风,通过数字音频处理管道将声音记录到主机PC上,且每月至少重新校准一次。测量距离设定为50cm,相较于之前的1m距离,缩短距离能更精准地分辨出低噪音显卡之间的差异。
通过测试,我们得到了不同显卡的噪音数据。在众多显卡中,MSI RTX5090 Suprim SOC在默认BIOS下噪音为28.4dBA,性能BIOS下为36.3dBA。与其他显卡相比,默认BIOS模式下,其噪音水平低于多数竞品,仅略高于RX6800XT(27.4dBA);切换到性能BIOS后,噪音有所上升,但仍处于可接受范围,在高端显卡中处于中等偏下水平。
MSI GeForce RTX5090 Suprim SOC在温度和噪音控制方面表现出色。其散热系统能够有效控制显卡在高负载下的温度,不同BIOS模式为用户提供了多样化的选择,可根据实际需求在温度、性能和噪音之间灵活权衡。对于追求高性能且对使用体验有较高要求的用户来说,这款显卡无疑是一个颇具竞争力的选择。
结结结:
MSI RTX 5090 Suprim SOC拥有出色的散热和静音效果,是目前最好的风冷显卡之一。然而,对于消费者来说,这仍然是一笔不小的开支。 相比之下,AMD的显卡在性能上与RTX 5090存在较大差距,且缺乏DLSS多帧生成和新的超分模型等软件优势。虽然上一代RTX40系列显卡在DLSS Transformers技术的加持下,图像质量得到了免费升级,但对于追求极致性能的玩家来说,RTX 5090依然是首选。 MSI GeForce RTX 5090 Suprim SOC在性能、散热和技术创新方面表现卓越,是一款极具竞争力的高端显卡。然而,其高昂的价格和一些有待改进的地方,也让消费者在选择时需要谨慎考虑。如果你追求极致的游戏体验和图形性能,并且预算充足,那么这款显卡无疑是你的不二之选;但如果你的预算有限,或者对显卡性能要求不是特别高,那么上一代产品或其他性价比更高的显卡可能更适合你。