ASIC芯片能否超越GPU?

爱玩的蛋哥 2024-12-15 10:54:04
ASIC 芯片

ASIC 芯片,全称为专用集成电路(Application Specific Integrated Circuit),是一种为特定应用或功能而设计的集成电路。在集成电路界,它被看作是为专门目的而设计制造的产物。简单来讲,就是根据特定用户的要求或者特定电子系统的需要来进行设计、制造,是一种量身定制的芯片,通常会被用于一些特定任务。

与我们常见的通用型芯片如 CPU、GPU 有所不同。CPU 作为通用处理器,除了满足计算要求,为了更好地响应人机交互应用,要处理复杂条件、分支以及任务间的同步协调,芯片上需较多空间用于分支预测与优化、保存各种状态以降低任务切换延时,更适合逻辑控制、串行运算与通用类型数据运算。而 GPU 拥有由数以千计更小、更高效的 ALU 核心组成的大规模并行计算架构,大部分晶体管用于构建控制电路和 Cache,且对 Cache 需求小,只有小部分晶体管完成实际运算工作,所以其计算速度快,擅长处理多重任务,尤其是重复性工作,比如图形计算,在深度学习运算方面也有独特优势。

ASIC 芯片则针对性更强,像专用的音频、视频处理器,以及目前很多专用的 AI 芯片等都可以看作是 ASIC 的一种。它面向特定用户需求,在批量生产时与通用集成电路相比,有着体积更小、功耗更低、可靠性提高、性能提高、保密性增强、成本降低等优点。不过它也有明显缺点,一旦芯片设计完毕,使用环境相对固定,若环境或者需求发生变化就可能无法使用,并且如果出货量不大,芯片成本就会比较高,只有出货量增大成本才会随之降低。

发展历程回顾

ASIC 芯片兴起于上世纪七八十年代,不过在早期,它并没有被大众广泛熟知。直到 2012 年左右,比特币挖矿进入白热化阶段,由于挖矿需求强烈,更加专业的矿机设备开始出现,其中就包括了专门为数字货币挖掘而定制的 ASIC 芯片。相较于之前的设备,ASIC 矿机效率高,能耗低,专注于挖矿这一特定任务,虽然功能比较 “偏科”,但专业性很强,也让更多人开始认识到了 ASIC 芯片。

2016 年,谷歌发布了第一代 TPU(Tensor Processing Unit)张量处理器,这是一款为机器学习而定制的 ASIC 芯片,可谓意义重大。据谷歌所说,TPU 的处理速度比当时的 GPU 和 CPU 要快 15 到 30 倍,而它最有名的应用成果就是助力 AlphaGo 的训练,使其打败了顶级围棋选手李世石,这一事件也让人们看到了 ASIC 芯片在人工智能领域的巨大潜力。

此后,众多科技大厂纷纷跟进,投入到 ASIC 芯片的研发中。例如英特尔推出了 VPU(视觉处理器)、英伟达发布了 DPU(数据处理单元)等。其实我们日常使用的手机里的主芯片 SoC(System on Chip),通常涵盖了多种功能模块组合,从某种程度上来说,它也可以被看作是一种 ASIC 芯片。

当下,人工智能正处于蓬勃发展的大爆发时期,大量新算法不断涌现,对算力的要求达到了前所未有的高度。在这样的背景下,越来越多的 ASIC 芯片被研发出来,并应用在不同的领域,相信随着技术、算法的进一步普及,ASIC 芯片未来还会有更多令人期待的演化和发展。

ASIC 芯片在 AI 领域增速有望超 GPU 的依据

市场需求层面

如今,AI 领域正呈现出蓬勃的发展态势,而与之紧密相关的芯片需求也在不断变化。依据巴克莱等发布的报告来看,AI 推理计算需求将会迎来快速提升,预计其在通用人工智能总计算需求中所占的比重将超过 70%,甚至有望达到训练计算需求的 4.5 倍,推理计算需求会超过训练计算需求。

目前,英伟达的 GPU 在推理市场中占据着约 80% 的份额,不过随着大型科技公司定制化 ASIC 芯片如雨后春笋般不断涌现,预计到 2028 年这一比例有望下降至 50% 左右。这是因为 ASIC 芯片是针对特定场景进行设计的,与通用型的 GPU 不同,它能更好地契合推理计算这类特定的需求。比如在一些特定的 AI 应用场景中,对于算力、功耗、成本等方面有着独特的要求,ASIC 芯片可以根据这些要求进行定制优化,使得其在应对推理计算任务时能够更加高效,从而在未来的市场中有着更大的发展潜力,其增速也就有了可能超过 GPU 的市场背景基础。

科技巨头布局情况博通与 Marvell

从一些亮眼的财报数据就能看出科技巨头在 ASIC 芯片领域强劲的发展态势。像博通在 2024 财年公司的人工智能收入增长高达 220%,达到了 122 亿美元之多,并且其预计 AI 产品收入在 2025 财年第一财季还能同比增长 65%。不仅如此,博通还透露当下正在与三个非常大型的客户一同开发 AI 芯片,按照预计,明年公司 AI 芯片的市场规模有望达到 150 亿 - 200 亿美元。

而 Marvell 同样表现出色,在其公布的 2025 财年第三季度财报(截至 2024 年 11 月 2 日)显示,期间收入同比增长 7%,环比增长 19%,达到 15.16 亿美元,三季度业绩以及四季度展望都超出了分析师的预期。该公司 CEO Matt Murphy 表示,业绩大增的最大原因就是来自亚马逊及其他数据中心公司对于新型定制 AI 芯片的采购销售。这些都充分证明了以博通、Marvell 为代表的供应商所面临的 ASIC 芯片需求十分强劲。

苹果、谷歌与亚马逊

众多科技巨头纷纷入局 ASIC 芯片领域,进一步推动着它的发展。例如,有消息称苹果正与博通合作开发 AI 芯片,外界基于博通的主打业务范围猜测这款产品将会是 ASIC 芯片,并且还有分析指出,苹果与博通的合作会进一步巩固博通在 ASIC 设计中的主导地位,这款芯片可能将在 2026 年准备好投产。

谷歌方面,在 “插队” OpenAI 发布其迄今最强大的 AI 大模型 Gemini 2.0 时,其背后的核心硬件为谷歌最强 AI 芯片 Trillium TPU,这同样也属于 ASIC 的一种。并且同日谷歌还宣布 Trillium TPU 普遍可用,这款芯片不仅在训练密集型大语言模型、MoE 模型上性能更强,而且在 AI 训练和推理方面性价比更高。

还有亚马逊,其 AWS 在月初发布了 AI 芯片 Trn2UltraServer 和 Amazon EC2 Trn2 实例,基于 ASIC 的实例性价比超越了基于 GPU 的实例,单个 Trn2 实例结合了 16 颗 Trainium2 芯片,可提供 20.8PFLOPS,相比当前基于 GPU 的 EC2 实例,性价比高出 30% - 40%。

由此可见,科技巨头们都看到了 ASIC 芯片在 AI 领域的优势以及发展前景,纷纷通过各种方式布局 ASIC 芯片,也让 ASIC 芯片在 AI 芯片领域的 “更优选择” 地位愈发凸显。

0 阅读:24