掌上AI谁在主宰?一个无线巨头蜕变,火力全开

科技数不简单 2024-02-24 03:53:17

隐身于智能手机OEM厂商之后,高通一向是一家安静的公司。对于一般手机用户而言,高通之名远不如旗下品牌“Snapdragon骁龙”那般如雷贯耳。这是一家技术见长、少有“绯闻”的公司,偶一为之的裁员才会占据头条。

高通上一次裁员,是在去年9-10月间,一次裁掉1300多人。据说,裁员的原因,是由于华为Mate 60 Pro问世,中国手机企业停止进口芯片,导致高通一下损失5000万颗的订单。甚至有传言说,高通正打算关闭上海办事处,从中国撤退。

这当然是不实谣言。去年11月,高通、英伟达、英特尔三大芯片巨头的CEO集体出动,游说白宫,要求废除一个月前针对中国出台的芯片出口禁令。尽管三巨头游说失败,高通对中国市场的重视,可见一斑。

高通大裁员的真实原因,是业绩下滑。财报显示,截至去年9月的2023财年,高通总营收358亿美元,同比下降19%,净利润72亿美元,同比暴跌44%。

在高通CEO Cristiano Amon看来,营收、净利润双降的高通,已在不得不变的关头,生成式AI兴起之际,正是高通变革之时。

端+云,混合型模型主导AI未来

按Amon的说法,高通的AI之路分两步走,第一阶段耗时十年,主要成果是开发出一个可普遍运行的AI引擎;第二阶段正在开始,重点在于探索不同领域、不同场景的AI应用。

作为一家硬件厂商,高通聚焦于AI在端侧的部署、落地,让生成式AI由云端向终端转移。

在终端设备商上的运行AI,无非有两种方式:一是云端AI。设备与云端AI相连,用户每一个查询请求必须发送至云端,由部署在云端的大模型处理,最后将结果发回终端。

一是混合型AI。本地设备参与一部分AI处理,另一部分在云端进行。比如,在一台内置模型的设备上查询,设备会优先运行本地大模型,只有一部分数据才会发送至云端。有时,本地部署的模型足够强大,可单独完成整个查询过程,无需云端参与。

混合型AI的好处是,云端的计算量大为减少,成本、能耗大幅降低。更重要的是,由于本地设备可访问当前位置、当前活动等实时上下文信息,本地化的AI响应与云端相比,更为快速、准确、高效,也更具个性化。

高通坚信,混合型AI一边本地化部署模型,一边又可调用云端计算能力,必将成为端侧落地AI的主流方式。

高通CEO Cristiano Amon

第三代骁龙,每秒可生成一张图片

自2007年iPhone问世,智能手机一直缺乏根本性的技术创造,逐渐走向存量竞争。作为高端手机芯片的龙头老大,高通也步入发展瓶颈。2023财年,高通的手机芯片业务营收,同比下降了22%。

2021年,Amon出任高通CEO,实现收入来源多元化,排在优先级第一。在Amon的带领下,高通一边巩固在高端手机芯片的王者地位,一边又向PC、汽车两大终端设备发起猛攻。

在接受英国《金融时报》采访时,Amon大胆预测,2024年将成为生成式AI快速引入智能手机的关键元年。大量引入AI功能后,智能手机又将开启新一轮增长,一举打破苹果、Google长期主导行业的竞争格局。

去年10月,第三代骁龙8正式发布,成为高通第一颗引入生成式AI的手机旗舰芯片,高通AI引擎也随之面世。在硬件层面,这一AI引擎的核心组件是Hexagon NPU神经处理单元。与上一代移动平台相比,内置NPU的Hexagon处理器推理速度提升98%,能效提升40%。

在《金融时报》的采访中,Amon指出,在端侧AI时代,芯片厂商竞争的主战场,将由训练转向推理。作为这一思想的生动体现,第三代骁龙8可支持运行100亿参数大模型,在70亿参数大模型上,每秒可生成20个token;运行文生图模型Stable Diffusion,每秒可生成一张图片。

一波AI PC热潮,高通独占ARM架构

长期低迷的PC市场,ARM架构的笔记本电脑是一抹亮色。Counterpoint的报告指出,至2027年,ARM架构在PC市场的占有率将由去年的14%提升至25%。高通与微软之间有一项Windows on ARM的独家合作,联想、惠普、戴尔等PC厂商开发ARM架构的笔记本电脑,必须基于高通的骁龙处理器。正由于这一渊源,高通也是PC处理器的一方重镇,与x86阵营PK,吃尽ARM架构大发展的红利。

去年10月第三代骁龙8问世之际,高通也一同发布了一款支持Windows 11的PC芯片骁龙X Elite。骁龙X Elite采用4纳米工艺制程,集成了Oryon CPU、Adreno GPU、Hexagon NPU,共同构成一整套异构计算体系,释放高通AI引擎的强大算力。

骁龙X Elite同样是一个专为生成式AI打造的计算平台,CPU和GPU性能是同级x86竞品的两倍,能耗却较低70%,被分析人士评为“史上最强”ARM架构PC芯片。由于搭载了Hexagon NPU,X Elite可在端侧运营130亿参数大模型,每秒生成30个token。

凭借骁龙X Elite芯片,高通跻身于这一轮AI PC热潮,成为一支不可忽视的力量。高通表示,正与微软合作,联合开发能耗最低、处理速度最快的下一代PC。

不过,据Arm公司CEO Rene Haas透露,微软与高通之间的Windows on ARM独家协议将在2024年到期。坊间传言,英伟达、AMD、联发科都在研发基于Windows on ARM的PC芯片,高通独占一块市场的格局正在打破。

十年打造AI引擎,高通变身AI公司?

软件定义汽车SoC芯片,即所谓舱驾一体芯片,高通的SA775、SA8797与英伟达的Thor并驾齐驱,早已是一方霸主。在CES 2024大展上,高通展出骁龙数字底盘产品组合,包括数字座舱、车联网技术、网联服务、先进驾驶辅助、自动驾驶系统,是一次大检阅。

在高通看来,汽车早已成为“带轮子的电脑”,是生成式AI落地的主要场景之一。在AI时代,汽车也将变成一个与手机、PC同等重要的下一定计算平台。高通希望,引入强大的AI引擎之后,骁龙芯片在数字底盘、舱驾一体领域的领先地位进一步扩展,一举改变公司定位、营收结构。

2023年,高通的汽车芯片业务营收19亿美元,占比总营收6%。Amon预计,2026年,高通的车用芯片业务营收将达40亿美元,2030年增至90亿美元。

由手机、PC、汽车三大行业的布局来看,高通AI战略的核心就是CPU、GPU、NPU三大组件构成的AI引擎。整个构架当中,NPU对应矩阵乘法为核心的AI应用,GPU对应Transformer等矢量与矩阵运算,CPU则负责整个AI任务的调度、数据传输,依旧为核心。

去年年中,高通发布了一份AI白皮书,坚定地相信,未来的AI将是端+云的混合架构。在接受《金融时报》采访中,Amon说:“新一代AI将在设备或边缘上开发,而不只是在云上开发,二者(端+云)将协同工作。”

横跨手机、PC、汽车的骁龙正崛起为一个高速、低功耗的AI计算平台,引领端侧AI的飞速发展。在重新定义骁龙的同时,Amon也在重新定义高通:生成式AI一日千里地发展,高通正由一家无线通信公司,转变为一家互联处理器和人工智能公司。

0 阅读:0

科技数不简单

简介:感谢大家的关注