玩酷网

刚看了一个据说是达到L3的智驾视频,果然和我想象中一样鸡肋,语音控制汽车的模式说

刚看了一个据说是达到L3的智驾视频,果然和我想象中一样鸡肋,语音控制汽车的模式说实话只有在某些简单且特定的场景下装的逼有用,其他场景下无力吐槽。

其实道理很简单,人本身就是高度进化的「AI」,我们也是接受世界多模态输入的,我们有识别推理执行的能力,然后借助外力工具去完成执行,整个效率是极其高效的,所以人类的反应速度是非常快的,也可以处理复杂的场景,快速决策快速执行,比如开车过程,其实车就是我们的执行工具,核心的还是人高度进化的大脑的处理输入、逻辑推理的能力,Action就是直接操作汽车的过程

简单的逻辑就是:输入-推理-执行,高效完成

回到智驾场景,如果把语音控制加入到智能驾驶过程中就会出现以下过程:

1、输入-推理(人类)-执行(语言输出)

2、再次输入语言(智驾大模型)-推理(智驾大模型)-执行(智驾大模型)

整个过程冗长且效率低下,经历了两次输入和两次推理,两次执行,这中间的时间损失是巨大的,其次在整个过程中,信息损失也有可能非常大,比如语言表达错误,智驾理解能力有问题,智驾执行错误等,所以这种方案出了装B,我觉得毫无意义。

正在的智驾大模型我的理解就是替换人类,独立完成所有信息的输入,再进行复杂的逻辑推理,然后直接执行指令,整个过程即高效又敏捷,出错率极低,其实我在想「我们人类是不是就是造物主搞出来的AI机器人」

这或许也是蔚来和华为大力押注世界模型的道理。

蔚来汽车[超话]