马斯克的「纯视觉」梦,还没有那么美

电车实验室 2024-01-10 15:35:21

作为自动驾驶领域「纯视觉」感知方案坚定的拥护者,翻开特斯拉 CEO 埃隆·马斯克的社交媒体账号,可以发现「马老板」常常会对于配备激光雷达的融合感知方案,提出一些质疑。

我们随机截取了几条内容,供大家了解:

从中可以发现,在过去两三年间,马斯克质疑「雷达感知」的切入点,基本都是围绕:雷达成像质量偏低、多模态感知融合难度较大而展开。

当然,激光雷达、高性能毫米波雷达较为高昂的成本,也是其中重要的因素。

与此同时,过去的一段时间,在特斯拉的引领作用下,部分车企纷纷选择加入,或者向外“吹风”即将会加入「纯视觉」路线。

给人一种「纯视觉」才是先进的、正确的技术路线,这样一种即视感。

然而,就在昨天(1月9日)上午,国内激光雷达领头品牌——禾赛科技,发布了全新一代 512线激光雷达 AT 512,其让人惊艳的成像效果提升,间接引发了社交平台上一场关于「智能驾驶感知方案」的讨论。

新雷达,牛在哪里?

之所以能引发一场讨论,其核心就在于禾赛 AT 512, 在成像分辨率上实现了「质的提升」。

先给大家介绍一下这颗重磅产品的基本参数:

・采用 512条收发通道

・视场角:120°(H)x 25.6°(V)

・全局角分辨率 :0.05°(H)x 0.05°(V)

・ 全局分辨率:2,400 x 512,点云密度(分辨率)相较上一代产品提升了足足 8倍!

根据禾赛官方公布的性能数据,新雷达能够实现300m的标准测距(@10%反射率)、400m的最远测距, 可以为系统安全决策增加 40% 以上的反应时间。

同时,得益于禾赛第四代自研芯片 1亿点/秒的超高处理性能,AT 512 能以约 1,230 万点/秒的超高点频,为系统提供图像级超清晰三维感知。

并引入 3D 堆叠、光噪抑制等前沿技术,在体积不变的情况下实现了性能全面升级。

一堆眼花缭乱的数据下来,可能容易让人有点不知该如何着眼评价。

其实早在半年前,我们在介绍沃尔沃 EX 90所搭载的激光雷达时,就简要介绍过激光雷达几个关键参数的「观看方法」,感兴趣的朋友可以回看一下当时的内容:《配备"地表最强"激光雷达,电动的沃尔沃也同样安全吗?》

这里我们简要回顾一下,这些关键的性能指标:

1、雷达视场角(FoV) :

视场角的大小决定了光学仪器的视野范围,也就是说这个数值决定了激光雷达的视野有多广/多宽。激光雷达的视场角越大,探测到的视野就越大。

综上可知,AT 512的「视野范围」为水平方向 120° x 垂直方向 25.6°。

2、角分辨率:

这数据可以通俗理解成为,雷达在水平和垂直方向扫射时,每隔多远会打一个点。

角分辨率的数值越小,点与点的间隔就越小,打下的点就越多,激光雷达全局生成的点云密度就越高,扫描到的物体自然也就越清晰。

综上所述,AT 512的「打点间隔」可以理解为,水平方向扫描时每隔 0.05°打一个点、垂直方向扫描时每隔 0.05° 打一个点。

这里做一个额外延展,如果有熟悉激光雷达角分辨率数据的朋友,会发现像沃尔沃EX90上配备的 Luminar激光雷达、以及蔚来车型上配备的图通达激光雷达,其在「ROI模式下」的角分辨率也可以达到 0.05°(H)x 0.05°(V) 。

看似与禾赛AT 512的 0.05°(H)x 0.05°(V) 数据一致,但实际的成像效果差异却是相当巨大。

这个差距体现在「ROI动态聚焦」和「全局范围」这两个名称上。

沃尔沃EX90和蔚来车型 0.05°(H)x 0.05°(V)的激光雷达角分辨率,是在「ROI动态聚焦」模式下所取得的数据。

这个功能可以让激光雷达主动提高某一区域的角分辨率,等于使用「放大镜」查看某个局部。

也就是说这两款激光雷达,只能在整个雷达视场角的局部,达到 0.05°(H)x 0.05°(V) 的角分辨率数据。

以根据蔚来公开的数据为例,他们使用的图通达激光雷达,能达到这个分辨率数据的「视野」范围仅为 40°(H)x 9.6°(V)。

图通达激光雷达 ROI功能

而禾赛 AT 512是「全局范围」,也就是整个视场角范围内,都能达到 0.05°(H)x 0.05°(V)的角分辨率。

和上面两款激光雷达相比,禾赛 AT 512属于是「我裸眼,就和你们用放大镜看得一样清楚!」

3、 线程:

这可以看作是雷达发出的电磁波束数量,多线激光雷达会通过投射出多条平行线,从而绘制出内容更丰富的“雷达点云图” 。

线程越多、点云图的成像就越清晰,但相对应的发射源和接收器数量也需要增加,成本自然也就会一路上涨。

像禾赛目前的主力产品 AT 128,采用的就是 128线程。问界 M9/智界 S7上搭载的华为最新激光雷达,采用的是 192线程。

而禾赛这次推出的 AT 512,则直接加倍再加倍,达到了 512线程。

线程的大幅提升,让雷达的点频数据达到夸张的 1,230万点/秒。相较之下采用 128线程的 AT 128,点频数据仅为 153万点/秒。

可以说 AT 512通过线程的大幅度增加,实现了「雷达点云图」分辨率质的提升。

为了给大家更直观的展现 AT 512在成像分辨率上的提升,我们找来了AT 512和其它几款主流激光雷达的「点云图」,进行直观对比:

相信不用介绍,大家都能轻易分辨出哪一张是禾赛 AT 512的「雷达点云图」,可见其在分辨率上的优势是十分明显。

不知道这种水准的成像效果,能否符合马斯克提出的:「非常高分辨率的雷达才有意义」,这样一个要求。

感知路线之争

介绍完禾赛 AT 512在性能上的大幅提升,我们要把话题收回开头所引入的「感知路线之争」。

关于特斯拉坚定选择「纯视觉」感知路线的故事,可以有很多的切入角度,也可以有很详细的过程讲述。

但回顾马斯克面向公众发表的看法,其中比较核心原因就两点:

1、成本:

在此前很长一段时间,激光雷达感知的分辨率,远比不上摄像头感知,并且激光雷达的成本非常高昂,综合评价下来性价明显偏低。

2、理念 :

作为 Open AI联合创始人、作为带领特斯拉取得如此辉煌成绩的那个男人。

马斯克坚信:既然人类能通过视觉感知完成驾驶任务,那么机器也必然可以!

尤其是通过搭建 BEV+Transformer的算法架构,引领全球自动驾驶领域发展趋势,再加上近期上新的「占用网络 」技术加持之后。

在国外市场一支独秀的特斯拉,他们所推崇的「纯视觉」路线,给人一种风光无限的观感。

而回到国内市场,从「高阶智能驾驶」开始走进公众视野开始,各大车企推向市场的车型都是采用「视觉+雷达」的多模态融合感知方案。

早期实现「城区领航辅助驾驶」落地的车型,基本都是采用激光雷达+毫米波雷达+视觉摄像头的融合感知方案。

直到2023年下半年,采用「纯视觉」方案的品牌,或是吹风即将采用「纯视觉」方案的技术路线,才开始在我们的视野里逐渐出现。

按道理,原本「纯视觉」感知和「多模态融合」感知,完全可以「你走你的阳关道,我过我的独木桥」,二者并行良性发展。

可在各路媒体基于种种原因的一顿拉踩,和各家车企的拱火宣传下,「纯视觉」和「激光雷达+多模态融合感知」这两种方案在一些受众的认知中,就变成了一种诡异的、水火不容的路线斗争。

支持「多模态」的认为「纯视觉」就是妥妥地不靠谱。

支持「纯视觉」的就觉得「多模态」是纯纯的落后的技术产物……

绝不是零和博弈

诚然,作为长期在产品端进行体验的媒体,按正常逻辑来讲,智能驾驶系统的落地体验,才是我们真正擅长的细分领域。

而作为较为靠前的「感知方案」技术路线,和大多数人一样,我们需要补盲的地方还有很多很多,需要和大家一同学习、一同探讨、一同进步。

但即便如此,我个人认为在「感知路线」这个开放性问题上,有一个基本的常识性认知是可以明确的,那就是:

「纯视觉」和包含激光雷达在内的「多模态融合」绝对不是一种「零和博弈」的关系,不同技术路线之间完全可以并行发展。

「纯视觉」方案在成本上有明显优势,现阶段在「占用网络」技术的加持下,已经可以实现「城区领航」在内的高阶智驾功能。

并且不存在多模态信息融合的难题,在产品端也能够让高阶智能驾驶下沉到更多的价格区间。

但缺点是在面对复杂道路环境、恶劣天气状况下的「可靠性」还有待市场进一步验证。

包含激光雷达在内的「多模态融合」方案,则在感知能力上拥有先天的物理优势,感知距离更远、能适应更多样的外界环境。

尤其是能透过激光雷达可直接生成 3D点云,获得道路环境的深度信息,比起摄像头拍摄 2D画面再转换成 3D信息,有显著的优势。

而随着像禾赛 AT 512这类拥有高分辨率的新一代激光雷达面世,激光雷达曾经的一大短板也被逐渐补强。

并且,在「占用网络」技术的加持下,多模态的信息能在BEV空间里实现统一的表示,对于多模态信息的融合也有积极帮助。

但缺点是价格偏高,且硬件布局容易与车辆外观设计产生冲突。

可见,经过一段时间的探索发展,两种「感知方案」的优缺点已经十分清晰,并且在适用工况、适用价格区间上,二者的优缺点还是高度互补。

在我们去年的「领航智能驾驶」测试中,我们测试了使用各种不同技术路线的系统。高精度图+激光雷达方案、高精地图+纯视觉方案、去高精地图+去激光雷达的多模态方案......

这些系统其实都能实现相同的「领航智驾」功能,例如高速NOA,但因为车型售价、系统能力上限的不同,功能的具体体验必然是有所区别。

而每一套「智能驾驶系统」选择什么样的「感知方案」,最核心的考量出发点,必然是基于它的成本范围和功能体验需求。

就好比现在我们去酒店订一座年夜饭,同样会提供 11个菜,价格从 999、1,999、到3,999不等。具体要如何选择,每个人都会结合自身的经济情况和口味习惯,进行综合判断,作出合适自己的选择。

如果最终都能吃上一顿称心如意的年夜饭,那又何来高低、对错之分?

最后回到这场稍显无厘头的「感知方案」技术路线口水仗,我们可以先回顾下两种技术路线的发展近况:

「纯视觉」方案:特斯拉FSD V12版本在海外大放异彩、国内多个纯视觉方案相继公布/落地。

「包含激光雷达的多模态」方案:城区领航功能落地持续快速推进、激光雷达性能记录被不断刷新。

而有趣的是,在二者并行良性发展,各自不断取得新突破的当下,有人却非要给它们分出个高与低!

我就很好奇,你搁那安安静静地看着它们「卷」,难道就不香吗?

0 阅读:15

电车实验室

简介:求真, 有趣, 这里是电车实验室。