特斯拉最重要的技术,开始大放异彩

电车实验室 2024-02-26 11:13:17

先认真看看这张动图。

你能发现动图里的视频内容是由 AI 生成的吗?

农历新年假期还没过完,OpenAI 首个视频生成模型「Sora」横空出世。

你只需要键入 Prompt,Sora 就会根据自己对现实世界内容的理解,生成出一段极度逼真的模拟世界短视频。

Sora 最奇妙的地方在于,不仅对键入的文本内容能够做出快速反应,还能够主动理解物理世界,使多个角色、镜头内容、视觉风格保持一致性。

Prompt:A Chinese Lunar New Year celebration video with Chinese Dragon.(一条与中国龙庆祝中国龙年新年的视频)

输入以上提示后,OpenAI 向我们展示了一段 Sora 生成的「共庆新年」的视频短片,人物之多,元素之多元,表情之多样,画面之生动足以以假乱真。视频生成模型成功破圈,AI 概念股独领风骚,新时代来临的高呼不绝于耳。

这场属于 AIGC 的又一次狂欢,马斯克显然有话要说。

在 X(原推特)的一次评论互动中马斯克表示,大约一年前,特斯拉就已经能够利用精确的物理原理制作真实模拟世界的视频了,只是训练的视频大多来自汽车的驾驶视频,也相对无聊一些。

Elon Musk 图片来自:AFP

说罢,马斯克搬出去年特斯拉 AP 负责人 Ashok Elluswamy 的视频给出了证明。视频中,特斯拉能够提供 7 个现实模拟视角,除此以外,马斯克认为特斯拉能够超越 OpenAI 的地方在于,生成视频过程中特斯拉能够预测极为准确的物理现实。

共计 7 个视角的模拟现实视频-截图来自 X

当然,两家公司业务的差异也让技术衍生出了不同的用途。对于特斯拉来说,模拟现实的生成技术能够帮助 FSD(特斯拉完全自动驾驶) 更好地理解实际的驾驶环境,积累经验迅速成长。

Sora 已然引爆 AIGC 新一轮风暴。那么代表特斯拉智驾至高水平的 FSD 进展如何?

摘不掉 Beta 的 FSD

FSD 对于特斯拉来说至关重要,重要到直接关乎特斯拉的未来销量。

去年年中,马斯克曾在股东大会上透露过两款全新平台新车,并毫不掩饰地对两款新车表达了超乐观的预期。他认为,两款新车能够为特斯拉赢得超过 500 万台的年销量。特斯拉的目标是在 2030 年卖出 2000 万台新车,除了目前的「纯电双雄」,新平台车型将会承担起绝对的销量主力。

年尾时分,这款紧凑级纯电新车更多信息浮出水面。据相关知情人士透露,这款 2.5 万美元(约合人民币 17.98 万元)的紧凑纯电车内部代号 NV9X,特斯拉去年曾向供应商发出过「Redwood」车型的报价、招标邀请,预计每周产量达到 10000 台(年产量接近 50 万台)。

尤其值得一提的是,新车预计将提供带有方向盘以及不带方向盘两种版本,在推出紧凑新车的同时,马斯克还想要打造出一台「极度干净」的 Robotaxi,而驱动这台不带任何人为操控装置车型的关键是 FSD。

可惜的是,自 2020 年 10 月特斯拉首次发布 FSD Beta 测试版本以来,马斯克频繁喊出 FSD 全自动驾驶即将实现的言论就像是一组现实的「皮诺曹」故事。

图片来自:REUTERS

马斯克对 FSD 近乎「吹捧」的夸赞,最早可以追溯到 FSD Beta V9 版本。

2021 年 7 月,特斯拉还在为剥离毫米波雷达车型重构底层算法,全新 FSD Beta V9 采用纯视觉技术路线,并首次新增了城市场景

2021 年 9 月,马斯克在推特上大赞 FSD V10 版本体验,并声称「FSD 10 will blow your mind」

2022 年 4 月,FSD V10.11 版本帮助车辆显著降低恶劣路况、天气下的误报

2023 年 4 月,特斯拉 FSD 迭代至 Beta V11.3 版本,从该版本开始,特斯拉打通了高速、城区 NOA 的系统架构

2023 年 6 月,特斯拉推出 FSD Beta V11.4.3 版本,将车道信息引入占用网络模型,提升「Cut-in」、「Cut-out」准确率

2023 年 7 月,特斯拉继续推出 FSD Beta V11.4.6,改进车辆的 AEB 表现

随着测试版本后缀小数点的增加,FSD 想要摘掉 Beta 的帽子看起来似乎「遥遥无期」。

转折点发生在 V11.4.6 版本之后,马斯克开始在推特上频频预热 FSD V12。他表示 V12 将把城市街道的驾驶堆栈升级为端到端(End to End)的神经网络,FSD 通过不断输入的视频数据学习成长,替代掉 30 万行的 C++ 人工代码。最终 FSD V12 的 C++ 代码仅剩下 2000 行,而更重要的是 FSD 将在 V12 版本中去掉「Beta」的后缀。

11 月,特斯拉首次向内部员工推送了 FSD Beta V12,尽管「Beta」的后缀仍未摘下,但采用端到端方案后的 FSD,让特斯拉的智能驾驶体验真正出现了拐点。1 月,在特斯拉全年业绩电话会议上,马斯克承诺 FSD Beta V12 将会在未来几周内向北美 40 万台汽车推送。

2 月 20 日,特斯拉确认开始向非内部员工车主推送 FSD Beta V12.1.2,此次收到推送的车型包括订阅了 FSD 驾驶包的 HW3.0/4.0 车型,随机推送 0.5%-2%符合条件的车主。

随着 V12 版本智驾逻辑的里程碑式跨越,FSD 摘掉「Beta」 的曙光已至。

算力轰炸,量变产生质变

FSD Beta V12 的实际智驾体验如何?我们不妨先回顾下去年马斯克亲自直播上阵的场景。

去年 8 月,加州 Palo Alto,马斯克在 X(推特)上开启了 FSD V12 版本的直播公测。马斯克驾驶一台搭载 HW3.0 智驾硬件的 Model S,从特斯拉工程总部出发,全程实况直播。

图片来自:X 直播画面截图

直播中,马斯克向我们强调了测试的「随机性」,这台 Model S 的行驶路线并非提前预设,而是在直播过程中随机选择路径点进行测试,在到达随机的导航终点时,FSD 模仿人类驾驶习惯,驱动车辆靠边停下。

整场直播下来,FSD V12 的发挥可圈可点,汽车驾驶风格不仅更接近人类,还在面对一些诸如施工改道这些「从未见过」的复杂路况时,FSD 也展现出了强大的学习能力,正确选择了行驶线路。

不过,45 分钟的智驾过程里也有过几次马斯克不得不接管的时候。其中一次,Model S 行驶至一处红绿灯路口,当左转绿灯与直行红灯同时亮起,FSD 就将左转绿灯识别成了直行绿灯,马赛克不得不介入刹停。识别乌龙后,马斯克也表示将会给 FSD 看更多类似的红绿灯识别视频,帮助 AI 深化对交通规则的理解。

虽有被迫接管,但相比 Beta V11 版本的性能飞跃,Beta V12 的首秀表现也算得上是瑕不掩瑜。可以确定的一件事是,神经网络的可成长性正在大幅地修窄 FSD 犯错的空间。

时隔 6 个月后的大规模推送,FSD 成长到了什么程度?我们不妨先看看一些收到随机推送的海外博主如何评价 FSD V12.1.2 的表现。

X 用户@AIDRIVR 在收到特斯拉推送后,火速下载并跟进了实测。实测过程中,他表示总计 45 分钟的测试时间里,FSD 的驾驶风格非常接近人类,并且做到了「零接管」。

AIDRIVR 还向我们进一步展示了 FSD Beta V12 的精彩片段。其中最出圈的片段是其展示 FSD 具备了 U 型路口自主掉头的能力,对此特斯拉 AP 规控主管 Paril Jain 兴奋地表示「最棒的事情是,特斯拉并没有为了实现 U 型弯掉头,专门给 FSD 投喂大量的相关训练视频」,也就是说,FSD 仅需要学习日常行驶数据,就可以在面临复杂路况时做出拟人、成熟的驾驶决策。

U 型弯掉头能力-视频截图来自 X@AIDRIVR

另一个场景则是 FSD 对路面浸水处的精准识别。无论是在日间还是白天,搭载 FSD Beta V12.2.1 的特斯拉车辆能够精确识别出路面的水坑,并做出减速、绕行等动作。AIDRIVR 在帖子里表示,他曾在 FSD 各大版本中对类似的路况进行过测试,但都无一成功,目前为止只有 V12 能够成功完成。

识别前方路面浸水处-视频截图来自 X@AIDRIVR

FSD 连续识别绕行前方水坑-视频截图来自 X@AIDRIVR

神经网络赋予了 FSD 更出色的博弈能力。X 博主@AIDRIVR 接着放出了 FSD 在窄路会车、通行时的反应。在住宅区的窄路会车场景中,特斯拉在感知到来车的存在后,迅速打方向换道让出空间,并在会车结束的瞬间,FSD 丝滑起步变道,完成了整个会车的过程。

狭窄道路会车表现-视频截图来自 X@AIDRIVR

而在面临一些距离更极限的窄道路况时,FSD 处理起来也游刃有余。AIDRIVR 放出了 FSD 通过施工窄道的表现片段,他称 FSD 在「英寸级」的距离中博弈,并迅速做出决策,同样是丝滑驶出了施工路段。

施工窄路通行-视频截图来自X@AIDRIVR

简而言之,相比 Beta V11 版本,FSD Beta V12 的驾驶风格更加拟人,也更加大胆,神经网络的可塑性让 FSD 的表现大放异彩,特斯拉智驾性能的质变,当中也离不开投入海量视频学习成长的「量变」。

不过,Beta V12 并非没有问题存在。另一位同样收到推送的 X 博主@CdotSwish 透露,尽管 V12 的驾驶风格丝滑并更像人类,45 分钟也无需接管,但在一些诸如「十字路口右转博弈」、「红绿灯前白线识别」的场景下会遇到犹豫、摇摆的情况。对此,马斯克也迅速做出了回应,他称「这些问题很快就会在 12.3 版本中解决。」

智驾的竞争归根到底,就是一场「算力大战」。我们不妨老图新看,根据 Omdia Research 的数据显示,特斯拉在去年累计达到了 15k 英伟达 H100 芯片的算力储备。然而马斯克曾在不同场合公开表达过特斯拉投入训练的算力不足问题,为了推进 FSD,马斯克亲承将会加大对英伟达、AMD 芯片的采购,特斯拉计划在 2024 年 10 月,总算力达到 100 Exa-Flops(约 30 万张 A100 芯片等效算力)。

图片来自:Omdia Research

去年 8 月,也是马斯克直播 V12 首秀的不久,有消息称特斯拉正在中国国内组建一支约 20 人的本地运营团队以及一支约百人规模的数据标注团队,加块推动 FSD 在国内的落地。FSD 落地国内的窗口初现,算力即是新马力,这场「算力大战」又会鹿死谁手。

3 阅读:2979
评论列表
  • 2024-02-27 08:48

    原来经历了n次重大更新,红绿灯还会出错[笑着哭],可见先前的问题有多严重,呵呵。现在存量是之前的n倍,而各种离奇事故却大幅减少,为啥,是因为无耻吗?无耻到各种问题都推卸到车主身上,无耻到通过召回更新后问题就减少了,更死不承认。呵呵,要是国内企业,早被骂死了,奈何洋人屁股白

  • 2024-02-27 06:29

    垃圾送命车

  • 之前吹GPT 引领智能驾驶 现在又sora 孙子

  • 2024-02-27 16:16

    马斯克最厉害的技术就是养狗

  • 2024-02-27 21:37

    自动驾驶是挡不住的,最多5年满大街都会是自动驾驶汽车

    海啸 回复:
    成都有无人出租车了
  • 2024-02-28 07:52

    科技大放光彩,值得点赞

  • 2024-02-28 03:45

    总比外卖和社区团购强

电车实验室

简介:求真, 有趣, 这里是电车实验室。