作为自动驾驶领域「纯视觉」感知方案坚定的拥护者,翻开特斯拉 CEO 埃隆·马斯克的社交媒体账号,可以发现「马老板」常常会对于配备激光雷达的融合感知方案,提出一些质疑。
我们随机截取了几条内容,供大家了解:
从中可以发现,在过去两三年间,马斯克质疑「雷达感知」的切入点,基本都是围绕:雷达成像质量偏低、多模态感知融合难度较大而展开。
当然,激光雷达、高性能毫米波雷达较为高昂的成本,也是其中重要的因素。
与此同时,过去的一段时间,在特斯拉的引领作用下,部分车企纷纷选择加入,或者向外“吹风”即将会加入「纯视觉」路线。
给人一种「纯视觉」才是先进的、正确的技术路线,这样一种即视感。
然而,就在昨天(1月9日)上午,国内激光雷达领头品牌——禾赛科技,发布了全新一代 512线激光雷达 AT 512,其让人惊艳的成像效果提升,间接引发了社交平台上一场关于「智能驾驶感知方案」的讨论。
新雷达,牛在哪里?
之所以能引发一场讨论,其核心就在于禾赛 AT 512, 在成像分辨率上实现了「质的提升」。
先给大家介绍一下这颗重磅产品的基本参数:
・采用 512条收发通道
・视场角:120°(H)x 25.6°(V)
・全局角分辨率 :0.05°(H)x 0.05°(V)
・ 全局分辨率:2,400 x 512,点云密度(分辨率)相较上一代产品提升了足足 8倍!
根据禾赛官方公布的性能数据,新雷达能够实现300m的标准测距(@10%反射率)、400m的最远测距, 可以为系统安全决策增加 40% 以上的反应时间。
同时,得益于禾赛第四代自研芯片 1亿点/秒的超高处理性能,AT 512 能以约 1,230 万点/秒的超高点频,为系统提供图像级超清晰三维感知。
并引入 3D 堆叠、光噪抑制等前沿技术,在体积不变的情况下实现了性能全面升级。
一堆眼花缭乱的数据下来,可能容易让人有点不知该如何着眼评价。
其实早在半年前,我们在介绍沃尔沃 EX 90所搭载的激光雷达时,就简要介绍过激光雷达几个关键参数的「观看方法」,感兴趣的朋友可以回看一下当时的内容:《配备"地表最强"激光雷达,电动的沃尔沃也同样安全吗?》
这里我们简要回顾一下,这些关键的性能指标:
1、雷达视场角(FoV) :
视场角的大小决定了光学仪器的视野范围,也就是说这个数值决定了激光雷达的视野有多广/多宽。激光雷达的视场角越大,探测到的视野就越大。
综上可知,AT 512的「视野范围」为水平方向 120° x 垂直方向 25.6°。
2、角分辨率:
这数据可以通俗理解成为,雷达在水平和垂直方向扫射时,每隔多远会打一个点。
角分辨率的数值越小,点与点的间隔就越小,打下的点就越多,激光雷达全局生成的点云密度就越高,扫描到的物体自然也就越清晰。
综上所述,AT 512的「打点间隔」可以理解为,水平方向扫描时每隔 0.05°打一个点、垂直方向扫描时每隔 0.05° 打一个点。
这里做一个额外延展,如果有熟悉激光雷达角分辨率数据的朋友,会发现像沃尔沃EX90上配备的 Luminar激光雷达、以及蔚来车型上配备的图通达激光雷达,其在「ROI模式下」的角分辨率也可以达到 0.05°(H)x 0.05°(V) 。
看似与禾赛AT 512的 0.05°(H)x 0.05°(V) 数据一致,但实际的成像效果差异却是相当巨大。
这个差距体现在「ROI动态聚焦」和「全局范围」这两个名称上。
沃尔沃EX90和蔚来车型 0.05°(H)x 0.05°(V)的激光雷达角分辨率,是在「ROI动态聚焦」模式下所取得的数据。
这个功能可以让激光雷达主动提高某一区域的角分辨率,等于使用「放大镜」查看某个局部。
也就是说这两款激光雷达,只能在整个雷达视场角的局部,达到 0.05°(H)x 0.05°(V) 的角分辨率数据。
以根据蔚来公开的数据为例,他们使用的图通达激光雷达,能达到这个分辨率数据的「视野」范围仅为 40°(H)x 9.6°(V)。
图通达激光雷达 ROI功能
而禾赛 AT 512是「全局范围」,也就是整个视场角范围内,都能达到 0.05°(H)x 0.05°(V)的角分辨率。
和上面两款激光雷达相比,禾赛 AT 512属于是「我裸眼,就和你们用放大镜看得一样清楚!」
3、 线程:
这可以看作是雷达发出的电磁波束数量,多线激光雷达会通过投射出多条平行线,从而绘制出内容更丰富的“雷达点云图” 。
线程越多、点云图的成像就越清晰,但相对应的发射源和接收器数量也需要增加,成本自然也就会一路上涨。
像禾赛目前的主力产品 AT 128,采用的就是 128线程。问界 M9/智界 S7上搭载的华为最新激光雷达,采用的是 192线程。
而禾赛这次推出的 AT 512,则直接加倍再加倍,达到了 512线程。
线程的大幅提升,让雷达的点频数据达到夸张的 1,230万点/秒。相较之下采用 128线程的 AT 128,点频数据仅为 153万点/秒。
可以说 AT 512通过线程的大幅度增加,实现了「雷达点云图」分辨率质的提升。
为了给大家更直观的展现 AT 512在成像分辨率上的提升,我们找来了AT 512和其它几款主流激光雷达的「点云图」,进行直观对比:
相信不用介绍,大家都能轻易分辨出哪一张是禾赛 AT 512的「雷达点云图」,可见其在分辨率上的优势是十分明显。
不知道这种水准的成像效果,能否符合马斯克提出的:「非常高分辨率的雷达才有意义」,这样一个要求。
感知路线之争
介绍完禾赛 AT 512在性能上的大幅提升,我们要把话题收回开头所引入的「感知路线之争」。
关于特斯拉坚定选择「纯视觉」感知路线的故事,可以有很多的切入角度,也可以有很详细的过程讲述。
但回顾马斯克面向公众发表的看法,其中比较核心原因就两点:
1、成本:
在此前很长一段时间,激光雷达感知的分辨率,远比不上摄像头感知,并且激光雷达的成本非常高昂,综合评价下来性价明显偏低。
2、理念 :
作为 Open AI联合创始人、作为带领特斯拉取得如此辉煌成绩的那个男人。
马斯克坚信:既然人类能通过视觉感知完成驾驶任务,那么机器也必然可以!
尤其是通过搭建 BEV+Transformer的算法架构,引领全球自动驾驶领域发展趋势,再加上近期上新的「占用网络 」技术加持之后。
在国外市场一支独秀的特斯拉,他们所推崇的「纯视觉」路线,给人一种风光无限的观感。
而回到国内市场,从「高阶智能驾驶」开始走进公众视野开始,各大车企推向市场的车型都是采用「视觉+雷达」的多模态融合感知方案。
早期实现「城区领航辅助驾驶」落地的车型,基本都是采用激光雷达+毫米波雷达+视觉摄像头的融合感知方案。
直到2023年下半年,采用「纯视觉」方案的品牌,或是吹风即将采用「纯视觉」方案的技术路线,才开始在我们的视野里逐渐出现。
按道理,原本「纯视觉」感知和「多模态融合」感知,完全可以「你走你的阳关道,我过我的独木桥」,二者并行良性发展。
可在各路媒体基于种种原因的一顿拉踩,和各家车企的拱火宣传下,「纯视觉」和「激光雷达+多模态融合感知」这两种方案在一些受众的认知中,就变成了一种诡异的、水火不容的路线斗争。
支持「多模态」的认为「纯视觉」就是妥妥地不靠谱。
支持「纯视觉」的就觉得「多模态」是纯纯的落后的技术产物……
绝不是零和博弈
诚然,作为长期在产品端进行体验的媒体,按正常逻辑来讲,智能驾驶系统的落地体验,才是我们真正擅长的细分领域。
而作为较为靠前的「感知方案」技术路线,和大多数人一样,我们需要补盲的地方还有很多很多,需要和大家一同学习、一同探讨、一同进步。
但即便如此,我个人认为在「感知路线」这个开放性问题上,有一个基本的常识性认知是可以明确的,那就是:
「纯视觉」和包含激光雷达在内的「多模态融合」绝对不是一种「零和博弈」的关系,不同技术路线之间完全可以并行发展。
「纯视觉」方案在成本上有明显优势,现阶段在「占用网络」技术的加持下,已经可以实现「城区领航」在内的高阶智驾功能。
并且不存在多模态信息融合的难题,在产品端也能够让高阶智能驾驶下沉到更多的价格区间。
但缺点是在面对复杂道路环境、恶劣天气状况下的「可靠性」还有待市场进一步验证。
包含激光雷达在内的「多模态融合」方案,则在感知能力上拥有先天的物理优势,感知距离更远、能适应更多样的外界环境。
尤其是能透过激光雷达可直接生成 3D点云,获得道路环境的深度信息,比起摄像头拍摄 2D画面再转换成 3D信息,有显著的优势。
而随着像禾赛 AT 512这类拥有高分辨率的新一代激光雷达面世,激光雷达曾经的一大短板也被逐渐补强。
并且,在「占用网络」技术的加持下,多模态的信息能在BEV空间里实现统一的表示,对于多模态信息的融合也有积极帮助。
但缺点是价格偏高,且硬件布局容易与车辆外观设计产生冲突。
可见,经过一段时间的探索发展,两种「感知方案」的优缺点已经十分清晰,并且在适用工况、适用价格区间上,二者的优缺点还是高度互补。
在我们去年的「领航智能驾驶」测试中,我们测试了使用各种不同技术路线的系统。高精度图+激光雷达方案、高精地图+纯视觉方案、去高精地图+去激光雷达的多模态方案......
这些系统其实都能实现相同的「领航智驾」功能,例如高速NOA,但因为车型售价、系统能力上限的不同,功能的具体体验必然是有所区别。
而每一套「智能驾驶系统」选择什么样的「感知方案」,最核心的考量出发点,必然是基于它的成本范围和功能体验需求。
就好比现在我们去酒店订一座年夜饭,同样会提供 11个菜,价格从 999、1,999、到3,999不等。具体要如何选择,每个人都会结合自身的经济情况和口味习惯,进行综合判断,作出合适自己的选择。
如果最终都能吃上一顿称心如意的年夜饭,那又何来高低、对错之分?
最后回到这场稍显无厘头的「感知方案」技术路线口水仗,我们可以先回顾下两种技术路线的发展近况:
「纯视觉」方案:特斯拉FSD V12版本在海外大放异彩、国内多个纯视觉方案相继公布/落地。
「包含激光雷达的多模态」方案:城区领航功能落地持续快速推进、激光雷达性能记录被不断刷新。
而有趣的是,在二者并行良性发展,各自不断取得新突破的当下,有人却非要给它们分出个高与低!
我就很好奇,你搁那安安静静地看着它们「卷」,难道就不香吗?