玩酷网

马斯克的「纯视觉」梦，还没有那么美

电车实验室 2024-01-10 15:35:21

作为自动驾驶领域「纯视觉」感知方案坚定的拥护者，翻开特斯拉 CEO 埃隆·马斯克的社交媒体账号，可以发现「马老板」常常会对于配备激光雷达的融合感知方案，提出一些质疑。

我们随机截取了几条内容，供大家了解：

从中可以发现，在过去两三年间，马斯克质疑「雷达感知」的切入点，基本都是围绕：雷达成像质量偏低、多模态感知融合难度较大而展开。

当然，激光雷达、高性能毫米波雷达较为高昂的成本，也是其中重要的因素。

与此同时，过去的一段时间，在特斯拉的引领作用下，部分车企纷纷选择加入，或者向外“吹风”即将会加入「纯视觉」路线。

给人一种「纯视觉」才是先进的、正确的技术路线，这样一种即视感。

然而，就在昨天（1月9日）上午，国内激光雷达领头品牌——禾赛科技，发布了全新一代 512线激光雷达 AT 512，其让人惊艳的成像效果提升，间接引发了社交平台上一场关于「智能驾驶感知方案」的讨论。

新雷达，牛在哪里？

之所以能引发一场讨论，其核心就在于禾赛 AT 512，在成像分辨率上实现了「质的提升」。

先给大家介绍一下这颗重磅产品的基本参数：

・采用 512条收发通道

・视场角：120°（H）x 25.6°（V）

・全局角分辨率：0.05°（H）x 0.05°（V）

・全局分辨率：2,400 x 512，点云密度（分辨率）相较上一代产品提升了足足 8倍！

根据禾赛官方公布的性能数据，新雷达能够实现300m的标准测距（@10%反射率）、400m的最远测距，可以为系统安全决策增加 40% 以上的反应时间。

同时，得益于禾赛第四代自研芯片 1亿点/秒的超高处理性能，AT 512 能以约 1,230 万点/秒的超高点频，为系统提供图像级超清晰三维感知。

并引入 3D 堆叠、光噪抑制等前沿技术，在体积不变的情况下实现了性能全面升级。

一堆眼花缭乱的数据下来，可能容易让人有点不知该如何着眼评价。

其实早在半年前，我们在介绍沃尔沃 EX 90所搭载的激光雷达时，就简要介绍过激光雷达几个关键参数的「观看方法」，感兴趣的朋友可以回看一下当时的内容：《配备"地表最强"激光雷达，电动的沃尔沃也同样安全吗？》

这里我们简要回顾一下，这些关键的性能指标：

1、雷达视场角（FoV）：

视场角的大小决定了光学仪器的视野范围，也就是说这个数值决定了激光雷达的视野有多广/多宽。激光雷达的视场角越大，探测到的视野就越大。

综上可知，AT 512的「视野范围」为水平方向 120° x 垂直方向 25.6°。

2、角分辨率：

这数据可以通俗理解成为，雷达在水平和垂直方向扫射时，每隔多远会打一个点。

角分辨率的数值越小，点与点的间隔就越小，打下的点就越多，激光雷达全局生成的点云密度就越高，扫描到的物体自然也就越清晰。

综上所述，AT 512的「打点间隔」可以理解为，水平方向扫描时每隔 0.05°打一个点、垂直方向扫描时每隔 0.05° 打一个点。

这里做一个额外延展，如果有熟悉激光雷达角分辨率数据的朋友，会发现像沃尔沃EX90上配备的 Luminar激光雷达、以及蔚来车型上配备的图通达激光雷达，其在「ROI模式下」的角分辨率也可以达到 0.05°（H）x 0.05°（V）。

看似与禾赛AT 512的 0.05°（H）x 0.05°（V）数据一致，但实际的成像效果差异却是相当巨大。

这个差距体现在「ROI动态聚焦」和「全局范围」这两个名称上。

沃尔沃EX90和蔚来车型 0.05°（H）x 0.05°（V）的激光雷达角分辨率，是在「ROI动态聚焦」模式下所取得的数据。

这个功能可以让激光雷达主动提高某一区域的角分辨率，等于使用「放大镜」查看某个局部。

也就是说这两款激光雷达，只能在整个雷达视场角的局部，达到 0.05°（H）x 0.05°（V）的角分辨率数据。

以根据蔚来公开的数据为例，他们使用的图通达激光雷达，能达到这个分辨率数据的「视野」范围仅为 40°（H）x 9.6°（V）。

图通达激光雷达 ROI功能

而禾赛 AT 512是「全局范围」，也就是整个视场角范围内，都能达到 0.05°（H）x 0.05°（V）的角分辨率。

和上面两款激光雷达相比，禾赛 AT 512属于是「我裸眼，就和你们用放大镜看得一样清楚！」

3、线程：

这可以看作是雷达发出的电磁波束数量，多线激光雷达会通过投射出多条平行线，从而绘制出内容更丰富的“雷达点云图” 。

线程越多、点云图的成像就越清晰，但相对应的发射源和接收器数量也需要增加，成本自然也就会一路上涨。

像禾赛目前的主力产品 AT 128，采用的就是 128线程。问界 M9/智界 S7上搭载的华为最新激光雷达，采用的是 192线程。

而禾赛这次推出的 AT 512，则直接加倍再加倍，达到了 512线程。

线程的大幅提升，让雷达的点频数据达到夸张的 1,230万点/秒。相较之下采用 128线程的 AT 128，点频数据仅为 153万点/秒。

可以说 AT 512通过线程的大幅度增加，实现了「雷达点云图」分辨率质的提升。

为了给大家更直观的展现 AT 512在成像分辨率上的提升，我们找来了AT 512和其它几款主流激光雷达的「点云图」，进行直观对比：

相信不用介绍，大家都能轻易分辨出哪一张是禾赛 AT 512的「雷达点云图」，可见其在分辨率上的优势是十分明显。

不知道这种水准的成像效果，能否符合马斯克提出的：「非常高分辨率的雷达才有意义」，这样一个要求。

感知路线之争

介绍完禾赛 AT 512在性能上的大幅提升，我们要把话题收回开头所引入的「感知路线之争」。

关于特斯拉坚定选择「纯视觉」感知路线的故事，可以有很多的切入角度，也可以有很详细的过程讲述。

但回顾马斯克面向公众发表的看法，其中比较核心原因就两点：

1、成本：

在此前很长一段时间，激光雷达感知的分辨率，远比不上摄像头感知，并且激光雷达的成本非常高昂，综合评价下来性价明显偏低。

2、理念：

作为 Open AI联合创始人、作为带领特斯拉取得如此辉煌成绩的那个男人。

马斯克坚信：既然人类能通过视觉感知完成驾驶任务，那么机器也必然可以！

尤其是通过搭建 BEV+Transformer的算法架构，引领全球自动驾驶领域发展趋势，再加上近期上新的「占用网络」技术加持之后。

在国外市场一支独秀的特斯拉，他们所推崇的「纯视觉」路线，给人一种风光无限的观感。

而回到国内市场，从「高阶智能驾驶」开始走进公众视野开始，各大车企推向市场的车型都是采用「视觉+雷达」的多模态融合感知方案。

早期实现「城区领航辅助驾驶」落地的车型，基本都是采用激光雷达+毫米波雷达+视觉摄像头的融合感知方案。

直到2023年下半年，采用「纯视觉」方案的品牌，或是吹风即将采用「纯视觉」方案的技术路线，才开始在我们的视野里逐渐出现。

按道理，原本「纯视觉」感知和「多模态融合」感知，完全可以「你走你的阳关道，我过我的独木桥」，二者并行良性发展。

可在各路媒体基于种种原因的一顿拉踩，和各家车企的拱火宣传下，「纯视觉」和「激光雷达+多模态融合感知」这两种方案在一些受众的认知中，就变成了一种诡异的、水火不容的路线斗争。

支持「多模态」的认为「纯视觉」就是妥妥地不靠谱。

支持「纯视觉」的就觉得「多模态」是纯纯的落后的技术产物……

绝不是零和博弈

诚然，作为长期在产品端进行体验的媒体，按正常逻辑来讲，智能驾驶系统的落地体验，才是我们真正擅长的细分领域。

而作为较为靠前的「感知方案」技术路线，和大多数人一样，我们需要补盲的地方还有很多很多，需要和大家一同学习、一同探讨、一同进步。

但即便如此，我个人认为在「感知路线」这个开放性问题上，有一个基本的常识性认知是可以明确的，那就是：

「纯视觉」和包含激光雷达在内的「多模态融合」绝对不是一种「零和博弈」的关系，不同技术路线之间完全可以并行发展。

「纯视觉」方案在成本上有明显优势，现阶段在「占用网络」技术的加持下，已经可以实现「城区领航」在内的高阶智驾功能。

并且不存在多模态信息融合的难题，在产品端也能够让高阶智能驾驶下沉到更多的价格区间。

但缺点是在面对复杂道路环境、恶劣天气状况下的「可靠性」还有待市场进一步验证。

包含激光雷达在内的「多模态融合」方案，则在感知能力上拥有先天的物理优势，感知距离更远、能适应更多样的外界环境。

尤其是能透过激光雷达可直接生成 3D点云，获得道路环境的深度信息，比起摄像头拍摄 2D画面再转换成 3D信息，有显著的优势。

而随着像禾赛 AT 512这类拥有高分辨率的新一代激光雷达面世，激光雷达曾经的一大短板也被逐渐补强。

并且，在「占用网络」技术的加持下，多模态的信息能在BEV空间里实现统一的表示，对于多模态信息的融合也有积极帮助。

但缺点是价格偏高，且硬件布局容易与车辆外观设计产生冲突。

可见，经过一段时间的探索发展，两种「感知方案」的优缺点已经十分清晰，并且在适用工况、适用价格区间上，二者的优缺点还是高度互补。

在我们去年的「领航智能驾驶」测试中，我们测试了使用各种不同技术路线的系统。高精度图+激光雷达方案、高精地图+纯视觉方案、去高精地图+去激光雷达的多模态方案......

这些系统其实都能实现相同的「领航智驾」功能，例如高速NOA，但因为车型售价、系统能力上限的不同，功能的具体体验必然是有所区别。

而每一套「智能驾驶系统」选择什么样的「感知方案」，最核心的考量出发点，必然是基于它的成本范围和功能体验需求。

就好比现在我们去酒店订一座年夜饭，同样会提供 11个菜，价格从 999、1,999、到3,999不等。具体要如何选择，每个人都会结合自身的经济情况和口味习惯，进行综合判断，作出合适自己的选择。

如果最终都能吃上一顿称心如意的年夜饭，那又何来高低、对错之分？

最后回到这场稍显无厘头的「感知方案」技术路线口水仗，我们可以先回顾下两种技术路线的发展近况：

「纯视觉」方案：特斯拉FSD V12版本在海外大放异彩、国内多个纯视觉方案相继公布/落地。

「包含激光雷达的多模态」方案：城区领航功能落地持续快速推进、激光雷达性能记录被不断刷新。

而有趣的是，在二者并行良性发展，各自不断取得新突破的当下，有人却非要给它们分出个高与低！

我就很好奇，你搁那安安静静地看着它们「卷」，难道就不香吗？

0 阅读：15

电车实验室

简介：求真，有趣，这里是电车实验室。

作者最新文章

汽车TOP

汽车最新文章