​何小鹏强调的“端到端”,徐雷希望“重新定义”

观山车局说 2024-07-25 12:00:50

始于特斯拉,不止于特斯拉。

文|智库君

近期,武汉街头的无人驾驶网约车成为众矢之的。“萝卜快跑”变身“苕萝卜”在武汉街头罢工,瘫痪的交通与无法控制的无人驾驶汽车让人们不禁发问,未来是否已来?“萝卜快跑”准备好了吗?

“最近两天Robotaxi有点火,和好几个AI/出行/L4业界朋友交流robotaxi的事情,”7月11,小鹏汽车董事长何小鹏在微博发文表示,“L4公司很多的技术路线还是算法+小AI模型的组合,都在痛苦的犹豫,是否应该转入端到端。我个人的建议是:别犹豫,赶紧改,后面那个才是大家伙。”

“您是否同意何小鹏的观点?”7月16日,在上海Nullmax技术发布会前,智库君独家采访徐雷时问道。

“我基本同意何小鹏的观点,但至于具体细节,还要看端到端如何定义。”徐雷回答道。

徐雷,何许人也?

纽劢科技(Nullmax)创始人、CEO兼CTO,毕业于中国科学技术大学计算机科学,美国纽约州立大学布法罗分校计算机科学博士,曾经任职特斯拉时Autopilot研发团队的核心成员。作为Tesla Vision深度学习负责人,从零开始领导搭建Tesla Vision深度学习网络,成功取代了特斯拉第一代产品中使用的Mobileye视觉系统。

在这场发布会上,纽劢正式推出了新一代自动驾驶技术Nullmax Intelligence(以下称“NI”),以更聪明、更拟人的方式应对行业自动驾驶难题。在视觉基础上,NI增加了对声音、文本、手势等信息的输入支持,通过多模态的端到端模型进行任务的推理,并构建了基于类脑神经网络的安全类脑,由系统整体输出可视化结果、场景描述和驾驶行为。

正如纽劢的标语“Bring AI-First Mobility to Life“(将AI引领的出行方式带入生活)所追求的,徐雷正与纽劢在AI领域展现宏图大志。

“我们要让车不仅是去记录场景、采集信息,还需要它具备‘举一反三’的能力。”徐雷解释道,“AI需要成为车的大脑,作为一种具身智能的应用。长期来看,这将成为解决AI赋予物理形态的机器与真实世界交互问题的答案。”

而后,徐雷将Nullmax端到端的宏伟蓝图向智库君缓缓展开。

重新定义端到端?

随着无人驾驶技术的发展,“端到端”逐渐成为了智驾领域最火热的概念。

7月17日,理想在官方微信公众号发布“什么是‘端到端’”的文章,并表示即将开启一体化端到端的早鸟试用。

5月20日,小鹏汽车举办AI Day发布会上,小鹏汽车董事长、CEO何小鹏已宣布端到端大模型上车。

4月25日,商汤绝影公布了量产的端到端自动驾驶解决方案UniAD(Unified Autonomous Driving)的道路测试表现。

端到端,顾名思义是从一个端口到另一个端口的过程。在无人驾驶技术中,端到端是指通过传感器一端采集输入环境信息,最终输出控制指令的过程。

既然“端到端”的概念已经有了如此简单直接的解释,企业间的不同定义又从何而来?

对此,徐雷表示,“一种是分模块的端到端,通过将感知,规划等不同模块串联起来,作为端到端模型;另一种,是感知融合的方案,通过感知决策和控制的模块进行数据驱动,发出端到端的控制指令。与前面二者不同的是,纽劢并没有在端到端内部划分负责感知,建图,规划的模块,而是通过使用一个模块解决了所有问题。”

重塑规则,Nullmax基于多模态、大模型为端到端提供了新思路。将视觉作为主要的传感器,另外单独的传感器将其他的语言、文字、手势、导航符号化输入大模型,这个大语言叫LMDA,即Large Multimodal Description Action Model。

此外,Nullmax在端到端中还加入了“安全大脑“的功能。如果将汽车在道路上遇到的情况比作法院受理的案件,那么多模态的模型则是“一级仲裁”,审理实线不能变道、红灯前面要停车等基础案例。而后通过”安全大脑“的输出便是“二级仲裁”,“二级仲裁”是基于岩思类脑研究院AI和脑科学交叉领域的研究,建立于动物天然的避障和导航的能力之上,去帮助自动驾驶更加安全。

徐雷解释说,这套多模态模型配合安全大脑的系统被称为Nullmax Intelligence,通过除视频、摄像头以外,还有音频、声音、文字、语言多模态端到端的大模型和安全大脑的概念,去解决智能驾驶的问题,打造一个能够跟世界交互且足够安全的“司机”。

作为尝试向汽车“注入灵魂”的科学家,徐雷博士说道:“未来,AI需要嵌入物理形态中去呈现,曾经生活中最常见的便是人形机器人,但为什么AI的呈现形式不能是一辆车呢?”

比特斯拉“更有效率”地收集数据

曾任职于特斯拉的徐雷,作为Autopilot研发团队核心成员搭建起Tesla Vision深度学习网络,成功取代了特斯拉的第一代产品中使用的Mobileye视觉系统。

无独有偶,徐雷带领的纽劢采用了以“纯视觉,真无图,端到端”作为技术方案,让人或多或少地看到了特斯拉FSD的影子。

那么,纽劢与特斯拉的区别到底是什么?

面对这样的灵魂拷问,徐雷表示,“首先,特斯拉是一个OEM(整车厂),对于特斯拉旗下的Model X、Model S、Model Y和Model 3使用的均是同一套传感器配置和控制器。也就是说,特斯拉希望研发一套Autopolit方案去解决所有问题。”

“这也是我离开特斯拉的原因之一,”徐雷补充道,“国内外车厂具有油车、电车等多种车型,自动驾驶方案需要具有丰富的多样性才能在市场中充分发挥其作用。我希望通过我们的努力,未来能够让自动驾驶像手机打电话的功能一样普遍。”

正如徐雷所说,纽劢将Nullmax Intelligence这套超级大模型支持不同的车型,不同位置和配置的传感器,将纯视觉的无图自动驾驶做成标准化的功能,让每一款基础车型至少都具备在城市道路和高架上开启自动驾驶的能力。

此外,纽劢的不同还体现在数据采集的方式上。特斯拉基于自身OEM(整车厂)的优势,其旗下车型可以将世界各地采集到的海量数据传回数据中心,让算法进行筛选、纠正、学习后,再进一步升级。

显然,作为OEM,特斯拉具备收集数据的明显优势,但是徐雷认为,这并非最有效率的方式。“尽管有上亿的数据,但在直道上跑一亿公里对大模型的能力提升并不会有太多的参考价值。”徐雷说道,“但是,我们的生成式AI通过分析困难场景已经可以做到‘举一反三’,将生活中更有质量的的场景信息合成出来,克隆真实世界中的场景和交通参与者的行为到这套系统。”

始于特斯拉,不止于特斯拉。

Nullmax在真实数据基础上通过AIGC方式生成虚拟数据,加速模型开发与迭代,尤其是稀缺的高价值数据。目前,Nullmax已经实现了生成元素、图片及视频。面向真实数据和虚拟数据,在整个获取、挖掘、标注以及模型训练、评估、推送的全流程当中,Nullmax均具备高效的自动化处理。

渐进式自动驾驶路线

发展自动驾驶技术,最终还是要解决载人和运货的问题。为了登上这座大山,大家选择了不同的技术路线。渐进式、多模态大模型的技术路线,为纽劢在发展过程不同的阶段,提供了不同的商业化机会。

自2016年成立以来,Nullmax坚持以渐进式路线打造无人驾驶,先后推出和落地了包括行泊一体在内的高中低配置智驾方案,为全球范围内的汽车厂商、Tier1等伙伴提供独特的多样化应用。

“在渐进式线路上的成果让我们成为了很好的供应商,同时上一阶段所积累的数据也是为下一阶段服务的。”徐雷说道。

据了解,纽劢科技在不同算力芯片上帮助企业打造了不同的方案,例如瑞萨科技、爱芯元智、黑芝麻。同时基于在大算力芯片上做到了城市级别智能驾驶,如英伟达芯片。

“纽劢在海内外均有许多Tier1和OEM的合作伙伴,端到端和更前沿的技术则与OEM合作较多。”徐雷向智库君透露,“很多的项目与技术仍在持续的推进,明年初可能会举行一场新的发布会,对Mobility和运人运货背后一条新的技术路线进行介绍。”

纵观发展全局,Mobility和Embodied AI(嵌入式AI)才是纽劢的志向所在。

“我们要让车不单去记录场景、采集信息,它需要具备举一反三的能力。AI需要成为车的大脑,作为具身智能的应用。”正如徐雷所言,“长期来看,这是为了去解决AI赋予物理形态的机器与真实世界交互的问题。”

0 阅读:5

观山车局说

简介:感谢大家的关注