突发!英伟达H20芯片在华订单大增,买家曝光

科技确有核芯 2025-02-26 21:23:58
电子发烧友网报道(文 / 吴子鹏)据路透社最新报道,六名知情人士共同透露,由于对 DeepSeek 低成本人工智能模型的需求激增,中国企业正在增加英伟达 H20 人工智能芯片的订单,这或许有助于缓解人们对 DeepSeek 可能致使人工智能芯片需求下滑的担忧。 此前,DeepSeek 爆火给英伟达带来了不小的冲击。2025 年 1 月,DeepSeek 发布 R1 模型的开源版本,英伟达股价在消息公布当天单日暴跌 16.9%,市值在短短三天内蒸发了 6000 亿美元。市场之所以有如此大的反应,一个重要原因是 DeepSeek 展现出了颠覆式的成本下降。它仅使用 2000 余个芯片集群,花费 560 万美元左右就能训练出高性能的 V3 模型,远低于其他国际 AI 大模型,为行业在低成本训练方面提供了新的思路与范例,让更多企业看到了以较低成本开发大模型的可能性。 然而,正如英伟达 CEO 黄仁勋所言,DeepSeek 对英伟达股票的冲击,源于投资者的误解。尽管 DeepSeek 在预训练 AI 模型方面取得了进步,但后期训练依旧重要,且需要大量资源。更为关键的是,部署 DeepSeek 推理应用同样需要大量的英伟达芯片。随着 AI 落地加速,英伟达作为全球最领先的计算芯片公司,仍然是最大的受益者。 DeepSeek 部署热潮带来大量芯片需求此前,DeepSeek 发布 R1 模型时,投资者抛售英伟达股票,主要担心的是 DeepSeek 的开源和低成本逻辑将终结Scalling Law 的发展。所谓的Scalling Law,是指在自然语言处理(NLP)和多模态模型领域中,随着模型规模、数据量和计算资源的增加,模型的性能会相应提升,并且这种提升呈幂律关系。 在大模型领域,Scalling Law 主要包括 Scale Out 和 Scale Up 两个方向。其中,Scale Out 即横向扩展、向外扩展,通过将多个低性能的机器组成一个分布式集群,来共同抵御高并发流量的冲击;Scale Up 即纵向扩展、向上扩展,在一个计算节点内通过购买性能更好的硬件,提升系统的并发处理能力。显然,DeepSeek 对 Scale Out 的冲击更大,也就是说计算芯片的需求没那么多了。然而,DeepSeek 部署量大幅提升之后,人们发现 DeepSeek 阻碍 Scale Out 发展的逻辑是错误的。 DeepSeek 带来的算法效率的提升并未抑制算力需求,反而因更多用户和场景的加入,推动大模型的普及与应用落地,带动数据中心、边缘及端侧算力建设。这使得为了满足不断增长的算力需求,通过 scale out 来扩展计算能力变得更为重要。换句话说,企业若要在数据中心部署 DeepSeek 进行大规模的模型训练和推理任务,对高算力、高内存带宽的芯片需求巨大。 已经有多位业内人士表示,DeepSeek 服务器的瓶颈主要在于 GPU 推理资源。若应用像 DeepSeek 官网一样经常宕机,会严重影响用户体验。 是谁在大规模购买英伟达 H20六名知情人士中的两位称,自 DeepSeek 上个月进入全球公众视野以来,腾讯、阿里巴巴和字节跳动对 H20 的订单 “大幅增加”。目前,腾讯和阿里巴巴已全面拥抱 DeepSeek,字节跳动则扮演着 DeepSeek 挑战者的角色,此前字节跳动的豆包大模型是国内排名第一的大模型。 目前,腾讯旗下的多个产品都已宣布接入 DeepSeek,包括腾讯元宝、腾讯文档、QQ 浏览器、微信搜索、《和平精英》手游等。数据显示,元宝自 2 月 13 日接入 DeepSeek-R1 模型后,一周内完成四次重大更新,新增图片理解、深度思考等功能,并通过微信搜索导流实现单日安卓新增下载量 160 万,iOS 排名从 200 名外跃升至第二。 阿里巴巴方面,1688、DataWorks 等平台也都已接入 DeepSeek。DataWorks 作为阿里云大数据生态中的核心产品,内置了阿里巴巴历经 16 年沉淀的大数据建设方法论,与数十种常见大数据引擎和 AI 计算服务深度适配,无论是数据湖、数据仓库,还是当下热门的湖仓一体解决方案都能适用。另外,阿里巴巴本身也是开源大模型重要的技术贡献者,此前我们也提到过 DeepSeek 也是阿里巴巴开源模型的受益者。 对于字节跳动而言,该公司主要考虑的是如何再次超越 DeepSeek,重新成为国产 AI 大模型的代表。此前,字节跳动CEO梁汝波谈到 DeepSeek 时表示,去年 9 月 OpenAI 发布长链思考模型、成为行业热点后,字节意识到技术重大变化,但没有特别觉得一定要马上复现,觉得早 1 个月晚 1 个月差别不大。“如果一开始重大问题就争先,我们有机会更早实现。” 无论是拥抱 DeepSeek 还是超越 DeepSeek,从现在 AI 大模型发展趋势来看,部署大量计算芯片来提供优质的推理服务是重点之一,而英伟达 H20 芯片则是比较受厂商青睐的计算芯片。 H20 是英伟达专为中国市场开发的人工智能芯片,旨在符合美国出口管制政策要求,替代受限制的 H100 等高端产品。H20 采用英伟达 Hopper 架构,拥有先进的 CoWoS 封装技术。H20 的 FP8 算力为 296TFLOPS,FP16 算力为 148TFLOPS,配备 96GB 的 HBM3 显存,GPU 显存带宽达 4.0TB/s,功率为 400W。在传输上,H20 支持 PCIe Gen5 x16,传输速率为 128GB/s;支持 NVLink 900GB/s 高速互联功能。 此前有统计数据指出,2024 年英伟达大约出货 100 万颗 H20 芯片。受 DeepSeek 部署热潮带动,腾讯、阿里和字节跳动等企业对英伟达 H20 芯片的订单大幅增加,预计 2025 年 H20 仍将会为英伟达带来可观的收入。
0 阅读:0

科技确有核芯

简介:感谢大家的关注