贾浩楠 发自 副驾寺智能车参考 | 公众号 AI4Auto
魏建军刚刚又打破了车圈一项记录:
直播智驾挑战中国最难城市道路——8D重庆。
智驾挑战重庆的车企老板之前有过,但魏建军有这么几个第一:
直播实况无剧本、路线无特定规划、系统没提前特调;
场景最难:直接上盘龙立交、解放碑地下环廊这样地狱级的路况。
了解重庆的朋友马上就明白难度和含金量:这是让本地老司机都头疼不已的场景。
上次魏建军说“卷智驾来保定”,这次面对重庆却感叹:小巫见大巫了。
什么样的表现距离上一次魏建军直播智驾保定路况,过去了75天。
肉眼可见长城最新的NOA系统(搭载在魏牌蓝山智驾版)有了不小的进步。
首先是测试的客观条件上,之前在保定的测试路线,是长城智驾团队提前选定的。而这次在重庆,则是输入好终点起点和途经点,由车载导航软件自动生成。
完全100%还原用户真实使用场景。
以及8D魔幻城市重庆,也是网友建议长城来挑战的。
充分说明一个问题:长城NOA在通行效率、可靠性和系统泛化性上已经足够成熟,完全有能力应对“闭卷考试”、“遭遇战”。
这次直播测试中,类似NOA避让行人障碍物、主动超慢车,自主汇入汇出等等,对如今的长城NOA来说已经不构成什么挑战,行云流水一笔带过:
所以直接看复杂度最高、最精彩的挑战。
其一盘龙立交,层层叠叠一共5层之多,最高处超过30米相当于十几层楼的高度:
主要挑战在于岔路多、进出口多,据说在最密集的路段,有将近20多个各式各样的汇入汇出匝道,本地司机说稍不留神走错出口,很可能就会变成“重庆一日游”。
长城智驾负责人介绍到,如果有高精地图事情会好办得多,但高精地图本身又会制约NOA的覆盖率,所以长城采取的是完全不依赖高精地图的技术路线,靠感知能力识别环境:
这里要澄清一点,所谓“无图”,是指无高精地图,但是普通导航地图一直在线并发挥作用。
不过导航地图给智驾系统提供的信息和给人类司机提供的没什么不同,无非就是告诉你下个路口拐弯还是直行。
也就是说,长城NOA从AI层面来看,已经摆脱了规则主导的枷锁,开始像人类一样去理解路况、认知世界了。
盘龙立交,考验重点是NOA的感知能力,而解放碑地下环廊则是感知和规控的双层地狱:
先来说说基本情况:解放碑地下环廊主体是一个环路,不过超级复杂,有9个进出口,而且道路狭窄,很多单行道:
又因为环廊本身连接着大大小小2万多个地下停车位,这就使得环路内部车流密集,进进出出的并线博弈屡见不鲜。
而且最难的是环廊出口是一个近乎90°的直角弯,很多不熟练的人类司机都要来回挪两把才能通过,长城NOA一把过,平顺丝滑:
不过魏建军也说了,这样的道路不是100%的成功率,仍然有人工接管的概率。他说智驾系统的研发本身就是一个不断精进的过程,量变积累到质变,这是由AI技术本质决定的客观规律。
魏总果然朴实又严谨。
魏建军之所以现在敢出来直播,也是因为长城智驾整体的技术水平和用户体验有了绝对的领先优势。
具体有多领先呢?
长城智驾负责人告诉智能车参考:行业TOP 3,没有任何吹牛成分。
背后什么技术评价判断之前,先看看长城到底技术怎样。
魏建军今天实测的NOA功能,背后是长城最新的SEE一体化大模型。
关键点是一体化。核心内涵是实现了感知决策一体化的链路整合。
不是严格的端到端大模型,因为这个“大黑盒”缺乏可解释性。
仍然具有感知、规划、决策等等子模型,但不再是各自独立的模块。首先由Transformer架构为基础的感知模型,从各个传感器输入数据中提取特征,无损输入到后续的规划、感知模型。
一体化体现在,长城使用数据驱动替代规则驱动,不再由规则具象化定义什么是好的驾驶行为,而是让模型像人类司机一样直接学习“如何开车”,可应对的路况复杂度大幅提升、可决策的驾驶行为更贴近人类。
而“无损”,则体现在OCC占用网络上车,颠覆了以往感知识别的“白名单”机制,系统不需要知道到底是什么障碍物挡路,只需要明白它在那里,再加上激光雷达的双重兜底冗余,足以输出高度准确的感知结果。
感知后面的规划、决策等等模块,都使用数据驱动的模型,而这样海量人类优秀驾驶案例数据的大模型,本身就是足够大的。
再回到长城最强调的智驾安全核心上来,在工程实践中,算法不可避免会有错检漏检、或者一些比较极限、和人类习惯不相符的驾驶行为,有的是安全隐患,有的不利于建立用户信心。
于是,长城特地在基于数据驱动的算法外面,加上了一层人为编写的规则“外壳”,作为极限场景下的兜底措施。
所以,SEE的含义其实是这样的,硬件层面的多重传感器冗余、软件层面的OCC、前融合算法代表的“safety”安全,以及大模型框架下数据驱动的的“Efficiency”效率。
最后,是去哪就能开(有导航)、到哪都好停(各种高难度车位、记忆泊车等等)的“Experience”体验。
列举一下长城在智驾方面的几条硬指标.
首先是算力基础设施建设,之前长城透露过,目前自建规模是1.64 EFLOPS(华为公布的是3.3 EEFLOPS)。
其次是框架体系,这里有两个重点,一个是以Transformer架构为基础的BEV感知模型,另一个是以数据驱动的AI模型渗透到智驾各个环节,数据驱动很重要,直接关系到智驾产品敢不敢用,好不好用。
最后是在技术细节层面,长城已经实现了去高精地图依赖、OCC占用网络上车等等前沿的自动驾驶驾驶技术的量产化。
对于自己采用的这套技术体系和路线,长城认为应该接近了“自动驾驶”的终局:
大算力基础+大语言模型认知能力+耦合感知
各家都在达成这样的共识并走向这样的技术路线,2025年应该是自动驾驶的ChatGPT之年。
此外,长城还提及了研发中建立的数据观:端到端驱动的自动驾驶技术体系,数据关键不是海量堆叠,而是场景分布——也就是我们常说的自动驾驶高价值数据。
年内“全国都能开”长城称“智驾TOP 3”,除了技术基础,更重要的依据是量产推送的节奏。
官方透露,魏建军在刚刚在重庆亲测的NOA,8月会率先在保定、深圳、成都、重庆4个城市开放。
12月底,就能在全国所有有导航的地方全覆盖NOA功能。
NOA落地进度跑在长城前面的有华为、小鹏这两家,而后续跟长城竞争行业第三位置的,是和百度关联密切的极越汽车。
补充一下,长城首批NOA推送这4个地点选的别有心意,分别代表着古城、一线、二线、山城几种不同的道路类型,全面检测长城NOA的能力。
这也说明技术可靠性、系统泛化性现在已经不是制约长城NOA覆盖率的主要因素,官方更多从数据质量、能力展示方面考虑。
实际上,长城智加研发团队这样告诉我们:
按照某些友商“开城”的标准,长城早就可以做到全国都能开了。
全面推节点选在年底,是“受制”于长城内部严格的质量把控,验证流程不走完不行。
魏建军还说了什么直播中除了智驾,魏建军还谈了一些其他有意思的事。
比如长城的灵魂摩托,魏建军坦诚做摩托有两个驱动因素,首先是情怀和热爱,其次是“显摆”:
8缸8档、小型轻量化发动机,就是让别人看看长城出手就能做到全球最好。
此外,行业最近热议、各个车圈大佬纷纷下场发表意见的“内卷”话题,魏建军也首次谈了自己的看法:
长城这样的民营企业是市场经济的产物,生而竞争,所以我们根本不怕竞争,怕的是不公平竞争。现在有些行业老总们呼吁的其实是不正当的、不公平的、弄虚作假的卷。
车圈就像跑马拉松,吃兴奋剂和不吃差距会很大。
只要是透明的竞争,我们认赌服输,这个没有什么可说的。
有点意思。