3月16日开始,特斯拉向全美订购和订阅用户推送FSD Beta V12.3版高阶辅助驾驶功能,意味着,特斯拉端到端自动驾驶开始体验了。
2023年被称为“智驾元年”,因为L2+级辅助驾驶有了更深层面的突破,“重感知,轻地图”已成为新的发展方向。到了2024年,随着华为ADS 2.0实现无图NCA,以及特斯拉美国推送的端到端体验,“纯感知”是不是会成为今年智驾领域着重的发展方向。
马斯克曾在社交媒体上表示,更新的V12是为FSD端到端AI保留的,从图像输入到转向、刹车和加速输出。而端到端为什么有改变智驾的能力,就因其更简便,真实的大数据,和学习能力更强的AI大模型。
去高精地图后,智驾走向了端到端?对于用户来说,很多人不了解智驾的端到端是什么。通俗来说就是“感知决策一体化”,也就是将“感知”和“决策”融合到一个模型中,比如ChatGPT就是一种端到端模型。
当下主流的智驾系统,几乎均采用模块化模型,也就是把感知、预测、规划分为三个独立的模型,每个模型相对独立,并且处于下游的规划模型需要依赖工程师编写大量代码去制定行驶规则,这也是为什么目前的智驾不“拟人”的感觉。
另外,这种独立模块的系统,进行一整套流程时,信息传递会出现缺失,再加上系统程序过于复杂,导致维护难度较大,同时也无法在复杂路况下应用。
总结来说,模块化模型,每个模型都要进行专门的训练、优化、迭代,随着后期维护越来越困难,需要投入的精力和成本就越来越大。另外,各独立模块如果有一方出现偏差,就能导致下面的方案全部出现偏差,导致执行错误。
而端到端,用一个模块来实现所有功能,也就是“没有中间商”,减少了信息传递错误,信息的输入和输出直接。好处正好与模块化模型相反,只需要对一个模型进行训练和优化,输入信号可直接输出控车信号。
当然,端到端也并非没有缺点。端到端非常吃数据,怎么理解,两方面。
一是端到端智驾如果出了差错,研发人员是无法从中得到确切原因的,也就是说一个模块集中的功能过于丰富,看似执行变得简单,但中间省略的步骤,也能导致问题数据无法得到分析。解决办法就是通过不断地训练、增加参数量来提高模型的准确率,可以理解为,这与是否存在完美的软件,是一个道理。
二是端到端的训练较难。如果说传统的感知模型训练,是标注有用的信息,相当于小学或初中水平,而端到端就是要深度学习驾驶行为,能掌握拟人的驾驶逻辑,需要更大的思维发散,而不是固定思维。就好比,感知模型在进行固定程式的科目三考试,而端到端则是拿到驾照后上路练车的过程。
上述两个点的核心就是,端到端深度学习和规避问题的办法,需要大量数据支撑,这些数据还必须是高质量有效数据。
虽然端到端对数据的需求更苛刻,但相比感知模型,其性能上限更高。也就是说,未来想要实现更高级别的自动驾驶,端到端是更好的解决方案。
端到端是更便宜的“代驾”?特斯拉FSD全套需要6.4万元,是目前最贵的智驾解决套装之一,是不是意味着,未来端到端正式商用,这套技术会更贵?实际上,不管是对企业还是用户,端到端上车,开发成本和购买成本,应该更低。
从企业角度看,端到端在研发、维护和训练上相比感知模型要更节省成本,毕竟不需要多线支出,仅对这一个模型开发就好。但另一个方面对于大数据,超大容量的数据存储,需要较高的成本支出,但感知模型也需要这部分成本,只不过相对较低。
从产品角度看,端到端智驾特性就是不需要激光雷达参与,但对摄像头和芯片算力的要求更高,这也是特斯拉今年升级了HW4.0,并将前风挡摄像头像素由120万提升至500万,并提升了FSD芯片架构。
特斯拉虽然将在4月1日涨价,但仅针对Model Y一款车型,也就是说智驾软硬件升级并没影响到特斯拉售价。
而感知模型解决方案,目前能实现高阶智驾的,几乎都配备激光雷达。虽然激光雷达今年的成本价下探至2000元到3000元,但这个成本也会随车价转嫁到用户身上。也就是说,虽然用户购买FSD全套价格,要比其他智驾系统要贵,但整车硬件上,特斯拉可以做得更便宜。
目前在国内,包括华为、小鹏、理想、蔚来、百度等企业都想在端到端上发力,但什么时候落地成了问题。特斯拉在全美发出的推送,也仅是一小部分的功能体验,有消息称,想完全商用最早要2025年能落地。国内车企基本采用跟随态度,由此来看,今年端到端落地商用的概率几乎没有。
如果端到端明年能实现商用,且法规允许,相比现在的模块化模型,端到端硬件上车成本会更低,同样的产品对比,端到端上车的会卖得更便宜。
即使目前还有包括大数据模型如何稳定上车,以及还需要大量的路测等这些问题,但端到端智驾已经成为智驾行业的下一个热点。毕竟从企业出发,端到端开发维护成本更低,从用户角度出发,端到端能进一步改善智驾成本,买车也就会更便宜。另外,更“拟人”的智驾,从体验角度上要比机械化的智驾体验更好,并且端到端学习能力更强,能适应更复杂多样的路况。
结语:端到端看起来不像是新的智驾解决方案,更像是模块化智驾终结方案。模块化智驾无论是高精地图成本、开城瓶颈、体验瓶颈,需要一一解决,而端到端,并不需要涉及这些。总而言之,端到端去掉了模块化智驾所有的麻烦,一旦解决大数据和稳定性问题,未来的智驾主流,就是它了。
人的驾驶过程就是识别预测规划分开的,并且人的智能远非机器能比,端到端反人类过程,虽然降低了成本,简化了过程,但一错皆错,可维护性大降,不同地区都要重复训练,机器的黑箱操作让人可能永远无法信任机器