01
索泰/映众显卡总部搬离中国香港
提到全球第二大显卡生产商,很多人都会有自己的意见,事实上,绝大多数科技粉对栢能集团(PC Partner)这个名字都会感到陌生,这并不奇怪,毕竟日常栢能作为“母公司”,很少会直接出现在终端市场,但仅一句“索泰(ZOTAC)、映众(Inno3D)和万丽(Manli)均为栢能集团旗下品牌”就能让人直观感受到栢能集团在显卡圈的能量。
而这一次,栢能集团之所以从幕后走向台前,却是因为总部的搬迁问题。
日前,多个新闻来源显示,为了保持市场竞争力,确保能够继续生产和供应高端显卡产品(如即将推出的GeForce RTX 5090型号),栢能集团选择将总部由中国香港迁至新加坡,并在新加坡SGX主板上市,股票代码PCT。
栢能还在印尼建立了新的显卡生产线(主要仍在国内),这样就可以继续生产RTX 5090等未来显卡,索泰、映众、万丽也都可以在海外市场销售。
而栢能在之前公开的《內幕消息》文件中提到,该集团计划将业务拓展至亚太区之新兴市场(尤其是东南亚),而调整总部所在地以及在印度尼西亚巴淡(峇淡)建立新工厂是栢能整体增长策略的一环。
参考索泰方面声明,栢能巴淡显卡工厂已实现 ZOTAC GAMING GeForce RTX 4070 Ti SUPER SOLID 显卡的初步试产。
目前,NVIDIA正在审核栢能的有关文件,如果符合美国商务部规定,就可以一切如常继续了。
当然,还是不能在国内卖。
02
显卡禁令下,核心AIC家族何去何从
栢能集团总部乃至生产线的搬迁,同美针对英伟达显卡的禁令有极强的因果关系。
近年来,全球科技竞争日益激烈,特别是在人工智能(AI)和半导体领域。美作为科技强国,一直试图通过技术封锁和出口管制等手段来维护其科技霸权地位。
为了阻碍中国AI产业的发展,美政府通过不断升级对华半导体出口管制,限制了包括英伟达在内的美国芯片公司向中国出口高性能芯片。这些措施主要针对A100、H100等高端AI芯片,以及RTX 4090等高性能消费级显卡。
尤其是对普通消费者而言,禁令导致英伟达RTX 4090显卡在中国全面下架,价格飙升至两三万元甚至更高,严重影响了国内游戏玩家和AI研究人员。同时,第三方商家趁机抬高价格,部分显卡价格暴涨至2.5-5万元。面对禁令,英伟达推出了性能降级版的RTX 4090D显卡,以符合新的出口限制要求,但这一举措并未完全解决问题。
事实上,相较于国内AI产业和玩家买不到英伟达RTX 4090显卡,更严重的冲击还是对于国内显卡市场以及半导体产业产生的“断链”问题。
之前不少4090 显卡是在中国大陆代工的,为了遵守新的出口规定,英伟达可能将不得不在中国大陆以外的地区开始生产旗舰显卡。英伟达在向美国证券交易委员会提交的一份声明中写道:“许可要求可能要求公司将某些业务从一个或多个地区转移出去。”
相较于栢能集团这种在全球都分布有办事处乃至工厂的跨国巨头而言,国内一些仅在中国境内开展业务的显卡品牌厂商就有些难受了。
而这一变化,在曾经辉煌的NVIDIA核心AIC家族中体现得淋漓尽致。
NVIDIA的核心AIC(Add-In Card Partner)是指NVIDIA授予其核心合作伙伴的称号,这些合作伙伴在NVIDIA的市场策略中扮演着重要角色。核心AIC通常是指那些与NVIDIA合作紧密、具有研发和制造能力的厂商,这些厂商能够生产采用NVIDIA显示芯片的显卡,并且在全球范围内享有较高的出货量和市场影响力。
核心AIC的数量相对较少,通常只有19家左右,这些厂商在NVIDIA的产品推广和市场扩展中起到了关键作用。科技圈小伙伴熟悉的XFX讯景、GALAXY影驰和Inno3D映众都是被广泛认可的核心AIC合作伙伴。
此外,七彩虹也在2010年成为NVIDIA的核心AIC,并且其高端产品线iGame系列在市场上享有很高的声誉。
然而,在显卡禁令下,曾经辉煌的NVIDIA核心AIC家族面临了巨大的挑战和变化。许多曾经赫赫有名的AIC品牌,如EVGA、ELSA、讯景XFX等,已经逐渐淡出人们的视线,成为历史的一部分。一些品牌如升技、青云、建碁、精英等已经退出显卡市场或不再生产显卡。然而,也有一些品牌如Colorful七彩虹、技嘉、影驰、微星等继续活跃在市场中。
面对美国对RTX 4090显卡的出口禁令,NVIDIA及其AIC合作伙伴们不得不调整策略。尽管NVIDIA在禁令前尽力向大陆的主要AIC提供货源,以确保RTX 4090能够正常供应,但禁令的实施导致了货源紧缺和价格上涨。
需要注意的是,由于无法在禁售区获得芯片生产板卡,大部分御三家和同德系产能也无法再为NVIDIA的高端卡提供支持。
作为显卡产业链下游,即便如风光的AIC品牌也没有太多的话语权,想要拿到RTX 5090显卡生产和售卖权限,短期来看恐怕只有选择同栢能一样搬迁总部或生产线,可这样一来,除本身企业需要面临巨额搬迁成本外,国内半导体产业链上的其它相关企业,也将直面产能迁徙问题。
当然,NVIDIA还是提供了针对中国市场的“定制版”显卡可选,从上游的角度为国内显卡产业链留下了“一线生机”,但就根本上而言,真正能够摆脱被禁令长时间卡脖子的,恐怕还是只有在国产GPU芯片上取得突破。
面对美对NVIDIA对半导体芯片的禁令,华为、燧源科技等公司正在积极探索国产芯片,以减少对美系及西方技术的依赖。然而,芯片研发是一项长周期、重投入的工作,短期内难以完全替代英伟达的产品,不过经过这些年的沉淀后,景嘉微、壁仞、摩尔制程等企业也逐渐在GPU领域站住脚跟。
03
信创大趋势下
国产GPU初长成
2024年11月6日,特朗普在2024年美国大选中高票获胜,成为第47任美国总统随着特朗普胜选,半导体行业格外关注美国《芯片与科学法案》进展。中国信创行业受美制裁,目前AI竞争力是各国安全的关键问题。而各国在努力实现AGI(人工通用智能)能力,美国为保持或扩大在这些领域的领先优势,对中国信创起到一定催化作用。
回顾过去今年,《2021 年在美中资企业年度商业调查报告》显示,特朗普在任期间严控中国在美半导体投资,2016 年中国在美投资达到500 亿美元规模,2017 年特朗普上台后,中国在美直接投资规模呈断崖式下降的趋势,2019年,中国在美直接投资金额只有 50 亿美元。
升级出口管制措施,通过《2018 出口管制改革法案》,明确了“军事最终用户”的定义,取消了一系列国家享受的民用最终用户的许可例外,并明确了外国生产商利用某些受管制的美国软件或技术生产的产品也会受到美国的出口管辖。
出台实体清单管理制度,实体清单实际上就是一份“黑名单”一旦进入此清单实际上是被剥夺了相关企业在美国的贸易机会,并对其进行技术封锁和国际供应链的隔离。
但长远来看,这样的打压只会让我国半导体行业国产设备、材料、代工厂等迎来发展契机,而能够满足AI算力需求的GPU更成有机会开启黄金赛道。
CPU算力的提升主要依赖于提高时钟频率和增加内核数量两大法宝,但由于频率墙与暗硅效应,CPU 算力提升进入瓶颈:此外,CPU 的工作流程遵循“Fetch(取指)- Decode(译码)-Execute(执行)-Memory Access(访存)-Write Back(写回)”的模式,擅长于顺序控制和决策,但在大规模并行数据处理任务中效率较低。
因此,传统CPU难以满足AI时代的算力需求,而能够实现大量数据快速并行计算的GPU迎来巨大的市场空间。
GPU的核心思想是通过简化架构,专注于并行计算,来大幅提升特定计算任务的性能。与 CPU 不同,GPU 将更多的晶体管用于算术逻辑单元,而不是复杂的控制逻辑和大容量缓存,从而牺牲了通用性,但大大增强了GPU的高并行计算能力。从算力增速来看,GPU远高于CPU,随着时间跨度的增加,这种算力差距将被快速放大。
随着AI的发展,未来需求进一步增加的趋势下 GPU市场规模将进一步扩大。具体数据方面,2023年中国GPU市场规模达到了807亿元,预计到2024年将增至1073亿元,显示出强劲的增长势头。然而,国产GPU在国际市场上仍处于追赶阶段,与国际巨头如英伟达、AMD相比存在较大差距。以2024年第二季度为例,全球PC GPU市场几乎被英特尔、英伟达和AMD三大公司垄断,而中国国产PC GPU市场份额趋近于零。
从GPU IP 核-计算架构-算法模型-原理验证-硬件实现-驱动开发等环节完全自主知识产权均不足,而从国内代表性公司来看,景嘉微在图形渲染 GPU领域持续深耕,天数智芯、壁仞科技、登临科技等一批主打AI及高性能计算的 GPGPU(通用图形处理器)初创企业正加速涌入。
尽管如此,国产GPU厂商正在通过技术创新和政策支持逐步缩小与国际领先水平的差距。
壁仞科技推出的异构GPU协同训练方案突破了大模型异构算力孤岛难题,摩尔线程则在AI模型训练领域实现了显著的性能提升。此外,国产GPU在数据中心、智能驾驶和游戏等特定细分领域中,有望实现快速增长。
以燧原科技为例,其专注于AI训练和推理芯片的研发,已经在这一领域取得了显著的成果。
燧原科技的产品线包括邃思系列芯片和云燧系列加速卡。邃思系列芯片包括邃思1.0、邃思2.0和邃思2.5,主要用于云端AI训练;而云燧系列则包括云燧T10、云燧T20、云燧T21等训练加速卡,以及云燧i10、云燧i20等推理加速卡,这些产品广泛应用于互联网、金融、交通、能源及智慧城市等多个行业和场景。
燧原科技在AI芯片领域具有显著的技术优势和市场竞争力。其产品不仅具备高算力和高能效比,还支持多种数据精度和主流深度学习框架,满足了不同场景下的多样化需求。此外,燧原科技还通过自主研发的“驭算”计算及编程平台,降低了客户的迁移成本,提高了开发效率。
壁仞科技则深耕通用计算体系,其显卡在算力和能效比上具有显著优势。
壁仞科技发布的BR100系列GPU芯片在算力上取得了显著突破。该芯片基于7nm制程工艺打造,拥有高达770亿个晶体管,并采用了Chiplet(芯粒)、2.5D CoWoS等先进的设计、制造与封装技术。
在算力方面,BR100实现了1024 TOPS INT8、512 TFLOPS BF16、256 TFLOPS TF32+以及128 TFLOPS FP32的出色表现。这些算力指标在FP32(单精度浮点)、INT8(整数,常用于人工智能推理)等维度上,均超越了国际厂商如NVIDIA的最新旗舰产品。
壁仞科技的BR100系列GPU芯片在能效比方面也表现出色。据官方数据,BR100的能效比超过了同工艺下的NVIDIA A100 GPU达78.8%,这得益于壁仞团队在技术和近存计算方面的创新。
BR100系列GPU还支持多GPU互连和多GPU实例功能。多GPU互连是实现大规模级联计算的关键技术,而多GPU实例则是GPU上云虚拟化的重要基础。这些功能使得BR100系列GPU在云计算、大数据处理等领域具有广泛的应用前景。
此外,景嘉微作为国内自主知识产权图形GPU的领军企业,致力于信息探测、处理与传递领域的技术和综合应用,其市场目标主要是国产替代,特别是在特种及信创行业,通过持续的高研发投入,推出具有自主知识产权的GPU芯片、图形显控领域产品及小型专用化雷达领域产品。
而除上面这些细分赛道外,我国国产GPU在大众应用领域的表现又如何呢?
04
无需妄自菲薄
能玩《黑神话》的国产显卡
相较于CPU,国产消费级GPU显卡的讨论热度要低不少,市场上甚至一度出现“中国显卡落后二十年”的声音,可事实真就如此吗?
其实GPU的设计和制造对中国真正的科技企业来说并不难,真正让国内GPU企业觉得"骨感"的,恐怕还是市场。尤其是GPU之前的最大的市场是游戏,要做游戏GPU,仅仅有硬件是不够的,还得让游戏开发商支持你的硬件。
就连AMD这样的大厂都受制于此,最近几年,AMD每一代只能维持很少的几款GPU产品,因为他们也没有精力去适配所有的游戏。再看英伟达,他们之所以能成为游戏GPU的王者,就是因为他们多年来在游戏生态上的投入。
在民用显卡赛道,摩尔线程和芯动科技其实已经取得了不错的成绩。
成立于 2020年10月的摩尔线程是一家以全功能图形处理器(GPU)芯片设计为主的集成电路高科技公司,其目前已经推出 MTT S30、MTT S70、MTT S80 等多款显卡,其中MTT S80 是目前最强性能产品,定位游戏显卡。
今年国产 3A 大作《黑神话:悟空》上线之后,摩尔线程通过多轮优化,已经让MTTS80实现了可玩的水平,国产显卡搭配国产 3A,成为中国科技行业发展的又一里程碑。
MTT S80(及衍生版MTT S70)是迄今唯一公开发售的国产游戏显卡,也是唯一支持DX12,通过不断的驱动迭代与优化,性能表现相比发布初期有了明显的提升。
具体性能方面,在摩尔线程v270.80.1驱动的帮助下,《黑神话:悟空》小西天场景平均帧率提升超过180%,《极品飞车:宿敌》平均帧率提升超过210%,《神力科莎:竞速》平均帧率提升约200%,《至暗时刻》平均帧率提升约50%,《战舰世界》平均帧率提升超20%。
摩尔线程还打造了基于夸娥计算集群的全栈解决方案,从千卡到万卡,正在逐步落地,MUSA生态也正不断壮大,大有替代CUDA的架势。
总体而言,虽然国产GPU之路步履维艰,但在技术创新、市场需求和政策支持的共同推动下,未来有望在全球半导体产业中占据一席之地,实现中国科技的崛起!