2018年3月18日晚,赫茨伯格成为世界上第一位因自动驾驶汽车而死的人。当晚,一辆经过改装的汽车以约70公里每小时的速度冲向推着自行车违规横穿马路的伊莱赫茨伯格。
撞击前5~6秒,驾驶系统检测到了前方物体,但由于不知道具体是什么,系统取消了最初评估。离物体2.6秒时系统识别初始自行车。1.5秒时,又识别为其他。
接着系统试图绕过前方的物体,但判定已经做不到了。撞击前0.2秒,汽车发出声音,提醒车辆将减速。撞击前0.02秒,车内安全员瓦斯奎兹抓住方向盘,汽车转入手动模式。但一切太迟了。
智能驾驶
事后,车辆所有者Uber全面叫停了自动驾驶路测全球各车企则努力提升智驾能力。
6年后的今天,当车企们宣传智驾实现了全程零接管,全国都能开,无图也能开,甚至宣称智驾比人驾安全10倍,智能驾驶真的可信吗?
今天就来聊聊争议中的智驾,智能驾驶真的比人类驾驶更安全吗?为什么智驾依旧无法完全避免事故?智能驾驶如何才能实现真正的安全?
智驾更安全智驾比人驾安全10倍。这个结论怎么来的?
24年初国内某车企引用了自家实验室2023年的数据,说车主在开启智能驾驶状态下平均每百万公里的事故率约为手动驾驶状态的1/10,而全球市值第一的车企也会在每季度财报中附上MILLIONSofMilesDRIVENbetweencollisions数据。
像最新的24年Q3安全报告就显示,使用autopilot的车辆平均近700万英里才发生一次碰撞,比人类驾驶安全10倍以上。
24年Q3安全报告
在数据层面,确实智驾比人驾更安全,但今天你要是问大家开车,你是更信人还是机器,很多人的回答一定是信自己,为啥会这样呢?
其实不难理解,智驾行业极端案例的万分之一,落到个人头上就是100%,而追求新奇的媒体则会集中性地报道这一个个100%,毕竟油车事故大家已经不稀奇了,倒是电车爆燃、智驾翻车这种新事物更吸睛。
再者,大众对于一个新技术的接受往往也需要一个过程。像硅谷战略专家杰弗里摩尔就提出过一个鸿沟理论,他就把高科技产品生命周期中的用户分为五类,创新者、早期采用者、早期大众、后期大众、落后者前期2.5%的创新者和13.5%的早期采用者。有钱也乐观,愿意为尝鲜买单,但想进入早期大众市场以及保守主义者市场,这就很难了。
他们往往追求产品的成熟度和可靠性,或基于性价比和大众口碑来判断。那今天的智驾就处于走向大众市场前的鸿沟中,甚至多数人其实没有体验过,也不愿意去体验,在发展的必经阶段,面对诸多质疑也就不足为奇了。
当然,这并不妨碍我们从更细的维度来拆开看这项技术,看看智驾是不是真的比人驾更安全。
首先,交通事故都是怎么发生的?2021年中国汽车中心发布的《自动驾驶汽车交通安全白皮书》,其中就援引了中国道路交通事故统计年报的统计,指出,2017~2020年,我国交通事故年均发生23.51万起,年均死亡人数达6.29万,另有24.38万人受到非致命伤害。
2014-2020年中国道路交通事故万车死亡人数
其中约90%以上的道路交通事故是驾驶员人为因素导致的,而人为因素导致的事故主要包含两方面,一是驾驶员无法对风险进行正常感知和识别等主观错误,比如未按规定让行、超速、闯红灯等违反交规的行为。二是驾驶员自身能力受限,无法正确面对内外部干扰,比如未留意其他交通参与者行为,驾驶水平低,对方危险驾驶。总而言之,人才是交通中最大的安全因素。
而有了智驾,首先软件设定上它就更听话。智驾程序都是依照交通规则而制定的,不会出现人类驾驶时的主观错误,比如闯红灯、超速、不打转向灯、变道等等。怎么我们安全高效、智能驾驶就怎么开,不惹事就很难出事。
其次,智能驾驶没有情绪,不会因为被老板骂而悲伤,不会因为在我的家乡,只有斑马没有线的武汉开就容易患上路怒。有了智驾,江湖也就会少一些打打杀杀,毕竟在车里吃着火锅唱着歌,它不香吗。
再者,智驾不像人一样需要休息,也不会因为长途驾驶而感到疲劳,而听话、稳定、不疲劳,这些都是安全的基础。
智驾系统
当然,今天优秀的智驾方案还会学习海量案例,一出场就能媲美驾龄几十年的老司机,就是来打高端局的。
那硬件层面,智驾也拥有比人更强的感知能力,就像人有一双会近视的眼睛和一个会走神的大脑,而智驾则往往配备了摄像头、激光雷达、超声波雷达、毫米波雷达等等十几个传感器,360度环绕,眼观六路,耳听八方,不仅是能看到你看不到的盲区,还能感知到肉眼感知不到的信息。
那以上就赋予了智驾强大的主动安全能力,给司机在四周插一眼,识别并规避风险,比如国内智驾第一梯队的华为ADS3.0,它就实现了前向、侧向、后向的全向防碰撞。
翻译一下,前向的AEB自动紧急制动,能主动识别车道内的行人、汽车、两轮车,不管是静止还是动态斜穿还是逆行,它都能准确识别,避免因驾驶员分神发生的危险,它能帮你踩刹车。
而紧急转向辅助系统ESA,当发现前方或侧前方有行人车辆、二轮车的碰撞风险,同时驾驶员转向不足时,它就会进行紧急侧向方向干预,帮你打方向盘。
当驾驶员无转向动作时,它还有EAES增强自动紧急转向,进行侧向干预。EAES其实也是AEB的进阶版,可以联合AEB做到边刹边让,就像给你配了个极限手速的隐形老司机一样,安全性也更上一个层级。
然后是后向的识别,加紧急制动,主要能规避倒车时的风险,对于很多侧方停车、倒车入库老大难的新手来说,妈妈再也不用担心我倒车撞墙了。
AEB自动紧急制动
再有很多事故是由于车主在起步行车、倒车时手忙脚乱,深踩了加速踏板,华为ADS3.0就配备了三重保险,首先有碰撞风险时,进行低级的误踩加速踏板告警。如果用户仍然深踩,则进行第二级的限制扭距输出,降低车速。要还有碰撞风险,则启动第三级AEB紧急制动,如驾校教练般一脚刹停。
总之,智驾的听话、稳定,强大的感知能力,是的的确确能提升驾驶的安全性的。
Buff叠满的老司机好,那要实现以上及这么多的智驾功能,稳如老狗地实现这些功能。智驾需要哪些具体的技术呢?只能说智驾的本质是复读机。
2015年的科幻电影《机械姬》里,全球最大搜索引擎公司蓝皮书的CEO纳森在展示机器人大脑时说道,人们认为搜索引擎是人们思考的事物,但其实那是人们思考的方式。
所以人工智能自动驾驶的本质是什么?2019年特斯拉自动驾驶日上,特斯拉AI总负责人安德鲁卡帕西也曾解释自动驾驶是模仿人类驾驶,因为现行的交通系统是基于人类视觉和认知系统来设计的,而从模仿人类开车到超越人类,比人类更懂开车,成为一位buff叠满的老司机,就是今天智能驾驶系统持续优化的底层逻辑。
那智能驾驶的技术框架可以分为三个环节,感知层、决策层和执行层,并具体涉及传感器计算平台、算法、OS、操作系统、HMI、人机交互界面等多个技术模块。
智能驾驶基础架构
先看感知层,还是拿目前市面上最顶的华为ADS3.0来说,这些鸿蒙智行车型最多配备了3个毫米波雷达、11个高清感知摄像头、12个超声波雷达,以及一个业界车规级量产线数最高的192线激光雷达,多传感器融合感知能力强的就像开了作弊器。
想象人类同时拥有猫头鹰的视力,蝙蝠的回声定位,猎豹的红外感应,还有前后左右自带好几套三体,人来了也得哭着回去。
那有人就要问了,为什么要用这么多种类数量的传感器呢?纯视觉方案不是也很流行吗?确实,但多传感器的道理就是摄像头如人眼,太明太暗,雨雪大雾就容易失灵。
去了远光灯,那就主打一个盲开毫米波雷达,就不怕这些,它主要靠波的发射折返来感知,像蝙蝠一样瞎着也能看路,激光雷达则能高精度地感知周围图像,且是主动发光,不怕黑夜。
所以传感器各有长短,组合在一起就是姐妹同心,形成全能六边形,近乎没有短板。
当然多说一句,在智驾层面,安全永远是第一位的。我认为安全优先于成本,因此华为在智驾上也没有走得很激进,没有选择更便宜的纯视觉方案,然后强大的感知硬件也要配合同样强大的软件,像华为ADS3.0再升级的god感知神经网络、融合激光雷达、摄像头、毫米波雷达等多种传感器的数据,就能实现对周围环境的全方位高精度感知。
简单来说就是ADS1.0主要识别白名单里的常见障碍物,像车辆、行人。2.0能识别更复杂的异形障碍物,像掉落的纸箱和落石,到3.0就能实现对整个复杂场景的理解了,感知得更全面且精准,思考方式更人类自然也就更安全。
华为智驾
而在决策层,华为ADS3.0使用的PDP决策神经网络可以实现跟感知层GOD感知神经网络的无缝衔接,从感知到决策信息无损传输,就像是一个整体。
二者合起来也就是我们最近常听到的端到端架构,那端到端有什么优势呢?
与端到端相对的是非端到端,也就是之前的模块化架构,a模块输入数据通过人为设计好的算法计算生成数据给b模块,b模块再生成数据给c模块,类似于传声筒这样信息传递效率不够,而端到端就相当于是一体成型,是一个整体,让整个智驾系统从感知到决策再到执行都能更迅速,最终实现更接近人类的驾驶方式。
再者,端到端还有一个好处是泛化能力。什么是泛化?简单来说就是智驾模型自我学习的能力。以前的智驾是通过人工规则定义各种场景,提前预设过,遇到同样场景的时候,它就能依葫芦画瓢做出系统设定的反应。
要是碰上没见过的cornercase,极端案例怎么办呢?也就没作业可抄了。而这种情况就用上了端到端的泛化能力。它不仅能在已有的训练数据上表现良好,还能举一反三、闻一知十,在未知的测试数据上也能做出准确预测,以此应对数据里没有过的极端案例。换句话说,端到端已经具备了接近人类的随机应变的能力。
那端到端有没有缺点呢?有,除了训练成本高,难度大,需要采集海量的高质量数据,最关键的是端到端模型。
面对极端案例,它既然是自己随机应变的,也就意味着它内部的决策过程和逻辑难以直观地理解和解释。他无法用老司机的逻辑去解释自己为什么这么做,甚至他还可能出现"抽风",当然这是他处理极端情况时的极端情况。那怎么办呢。
华为ADS3.0选择在端到端的基础上再增加一套冗余,也就是它的本能安全网络,这套网络主要是基于各种极端情况的数据进行训练,比如交通部门的交通事故库,以及各种上强度的极端案例的云端仿真。
华为ADS3.0
那当遇到以上极端案例时,就会触发本能安全网络,像人手碰到火一样本能地收回。而有了这套本能安全网络的兜底,华为ADS3.0就能更好地规避端到端AI幻觉的抽风问题,更有效确保智驾的安全性。
此外,这位老司机还通过云端训练,不停地反馈学习进步,主打一个比你优秀还比你努力。
而华为整个云端训练数据中心的计算、网络、存储、操作系统等均为自研。这样的好处是能做到平均连续30天训练不中断模型每5天迭代一次,大幅领先于业界。
当然不止云端、车端算法等软件层面,也包括传感器、域控制器等硬件。华为智驾整个链路都是自主研发的,这样的好处是采用统一的接口和通讯协议,对接起来更高效。
而每个部件响应快10毫秒,10个部件就是100毫秒,100码下你离危险就远了2.78米。
总之,华为ADS3.0拥有强大的多传感器融合感知端到端算法架构本能安全、网络冗余、快速的云端训练迭代能力以及业界领先的自研体系,这些都在让它模仿并超越人类驾驶,堪称一位buff叠满的老司机。
1840年,伦敦当局因为担心汽车产生的噪声、烟雾以及蒸汽机锅炉爆炸,开始明令禁止汽车在城市道路上行驶。1865年,因为铁路公司和驿站马车公司担心汽车跟自己抢生意,英国通过了《红旗法案》,要求每一辆在高速公路上行驶的机车都必须配备3名乘务人员,其中一人需要举着红旗或灯笼走在汽车前至少60码的地方,以警示其他道路使用者。
华为智驾
后来我们用了几十年的时间去适应汽车的大规模量产和普及,而今天智驾的发展则更加大步流星,对我们的观念和交通方式造成剧烈冲击。
诚然,今天的智驾就像昨日的汽车一样,并没有达到完全体,面临着诸多安全问题,还做不到完全零事故的水平。我们审视和质疑智驾天经地义,但科技的发展需要过程,再好的技术也不可能做到完美。
毕竟在完全自动驾驶到来之前,你可以保证智驾不撞人,但不能保证别人不撞你。你可以保证智驾安分守己,但不能避免网上销量数以百计的智驾辅助离手神器。而当一部分人开始用双手离开方向盘去预期它和批评它,这些关于智驾的争议就恰恰反映了人们对它的肯定。
从质疑到普及,无非是时间问题,也只是时间问题。只能说科技是必须领先于市场,科技终将改变市场。
文本来源@阿泰(阿Test正经比比)的视频内容