文|李安琪
编辑|李勤 杨轩
36氪独家获悉,小鹏汽车自研的AI智驾芯片将于今年二季度正式量产上市,首发搭载于小鹏的全新车型。
小鹏的AI智驾芯片命名为“图灵”,小鹏从2020年投入人力研发,于去年8月流片成功。
据36氪此前报道,这是一颗针对AI需求、端到端大模型等设计的芯片,AI算力接近3颗主流智驾芯片的水平,“大约700Tops,与英伟达最新的AI芯片Thor 接近”。
小鹏的计划是,将该芯片不仅用在汽车,未来还将搭载在AI机器人和飞行汽车上。
有内部人士告诉36氪,据小鹏汽车高层透露,这颗芯片集成了2个小鹏自研的神经网络处理大脑,并面向神经网络做了特定架构处理。同时,该芯片比通用车规高算力芯片利用率提升20%,“最高能处理30B(Billion,即300亿)参数的大模型。”
300亿的模型参数支持算得上惊人。作为对比,当下理想汽车的VLM(视觉-语言模型)参数量约为22亿。但模型参数量越大,也往往伴随着模型推理的较高延迟问题。如何解决时延问题,小鹏汽车尚未披露。
「英伟达大算力芯片缺位,蔚小理直追」在行业“端到端”浪潮下,车企们的智能驾驶进化,也开始依赖大模型、海量数据和巨量云端算力。这也催生了行业对于大算力AI芯片的需求。
英伟达最新一代车载AI芯片Thor,原本是全行业的希望。这是一款专门为端到端、AI大模型等技术基座设计的芯片硬件平台。最初的算力设计达2000 Tops,原计划于2024年中量产。
但36氪从行业中了解,英伟达Thor的量产遇到了挑战,目前向市场供应的基本是750Tops版本,“硬件、软件都还有缺陷。”有汽车行业人士向36氪表示。
该行业人士表示,甚至现在英伟达已经不承诺算力了,“可能实际上车实际和发布的数字会有很大差别。”
而此前宣布采用Thor芯片的车企,如比亚迪、极氪、理想、小鹏等,可能都会受到一定影响。在当下竞争如此激烈的汽车市场,因为芯片产品的节奏不顺而拖延新车发布,车企很可能会错过一些关键的产品占领市场时间窗口。
某种程度上,自研芯片可以帮车企争取多一些进度条筹码。
小鹏、蔚来、理想三家筹备芯片自研4年多,如今在陆续结果:蔚来5nm的自动驾驶芯片“神玑NX9031”,目前已经随着蔚来78.8万元的豪车ET9交付而进入量产状态;
据36氪汽车了解,理想自研的智驾芯片也接近流片状态。如果芯片节奏顺利,理想也可能向自研芯片倾斜更多车辆资源。
而小鹏的智驾芯片,也将于二季度迎来量产上车时间。届时,配合全新车型亮相,小鹏的智驾芯片也能迅速在市场上得到验证。
「小鹏自研芯片、推基座模型,重新拼抢“智驾一哥”」“智驾”曾一度是小鹏汽车的专属标签。但近两年,华为、理想、比亚迪等,都在拼抢这一智驾科技标签与第一梯队的风头。
而小鹏通过自研芯片,不仅希望带来更高效的智能驾驶软硬件一体效果,也想重新掌握智驾技术进化的主动权。
特斯拉是智能驾驶软硬件一体的鼻祖。特斯拉从2021年开始重写智驾软件底层架构,从BEV(鸟瞰图)、OCC(占用网络)、端到端模型等,特斯拉给国内智驾同行带来了许多启发。
根据最新进展,特斯拉的焕新车型已经搭载了最新的AI4硬件,基于端到端技术路线的自动驾驶软件功能包FSD也落地中国。不少行业人士认为FSD领先行业半代至一代。
但2021年后,特斯拉没再仔细具体公开过,“端到端”方案实现的软硬件技术细节。中国的智驾学徒们也在尝试自己的路径。
融合多模态大模型的智驾,是国内玩家们找到的下一个方向。
典型的案例是,理想汽车去年凭借“端到端模型+VLM(视觉-语言模型)”量产方案,挤入了智驾第一梯队水平。
理想的方案结合了快思考和慢思考,其中“端到端”模型用来应对95%的场景问题,而VLM模型对复杂交通环境具有更强的理解能力,可以给端到端提供相关驾驶建议。
近期,理想汽车还将更激进地将两个模型结合,升级到VLA(即视觉-语言-动作模型)多模态大模型。这种模型范式,最早于2023年7月由谷歌 DeepMind推出,用户机器人领域,随后向智能驾驶行业扩散。
小鹏的智驾软件也在朝,VLA多模态模型直接控制车辆硬件的方向进化。
去年5月20日,小鹏推出了端到端智驾大模型。比起传统的基于规则的智驾方案,端到端模型由AI驱动,进一步实现了信息的无损传递。
不过在今日4月14日技术分享会上,小鹏汽车自动驾驶负责人李力耘表示,“如果只局限于车端的算力,那模型大小受限,能消化的数据也是有限的。只有超越车端芯片算力限制,用更大模型,更海量的数据,才能实现车端的智能。”
但不同于同行在车端直接落地VLA模型,小鹏的方式是,先在云端训练出一个超大模型基座,然后通过知识蒸馏小模型的方式,将模型智驾能力保留到车端。“这能够突破车端稀少AI算力带来的模型上限。”
4月14日技术分享会上,小鹏正式提出了“世界基座模型”的概念,李力耘称内部正在开发一个720亿参数的超大规模自动驾驶大模型。
据他介绍,这个世界基座模型具备链式推理能力(CoT),在充分理解现实世界的基础上,能够像人类一样进行复杂的常识推理,并将推理结果转化为行动,例如输出方向盘、刹车等控制信号,实现和物理世界的交互。
“最终实现多模态大模型控制车辆的效果。”李力耘向36氪表示。
据李力耘分享,过去一年,小鹏的研发团队先后开发了2B、7B、72B尺寸的基座模型,目前已经着手推进72B超大规模参数世界基座模型的研发,参数量是主流 VLA 模型的35 倍左右。
小鹏还称,目前智驾训练数据量达到了2000万clips,年底会达到2亿clips。
小鹏世界基座模型负责人刘博士称,不久前,小鹏汽车已经将“基座大模型控车”的理论变为现实,在后装算力的车端上用小尺寸基座模型实现了控车。不过小鹏也表示,这还是非常早期的实车测试,但基座模型已经展现出令人惊喜的基础驾车技能。
为了研发基模,小鹏汽车还表示,目前已经建成了国内汽车行业首个万卡智算集群,拥有10 EFLOPS的算力,集群运行效率常年保持在90%以上。
小鹏相信,自动驾驶领域的Scaling Law(规模法则)仍然生效。“参数规模越大,模型的能力越强。同样的模型大小,训练数据量越大,模型的能力也会越强。”
小鹏汽车的目标是,在今年下半年期望L3自动驾驶进入商业化初期,2026年探索L4级自动驾驶。
当下,智驾愈发向AI靠拢,在AI软硬件投入之外,还考验着着车企的AI人才密度。例如,小鹏推进基座模型的正是北美团队;小米雷军也从英国智驾公司Wayve挖来技术大牛陈龙攻克VLA模型。
这是一场全方位的竞技,资金、硬件、软件、人才,智驾玩家的速度差也将从这里体现。