今晚的理想AI Talk第二季 ,李想借着VLA回应了近期关于“有人觉得辅助驾驶应该被叫停”的问题,回答的也比较经典:
“我觉着我们这么多年,从规则算法,做到了端到端+VLM,然后今天真正的迈入到了VLA(视觉语言行动模型)的阶段,我觉得比较像什么?比较像黎明前的黑暗吧。我觉得黎明马上就要来了。但是会先经历一个黑暗的过程,之所以有黑暗是因为要迎来黎明。我觉得这是今天这么一个阶段。”
在李想看来,VLA(Vision-Language-Action Model,视觉语言行动模型)才是交通领域上真正能够让AI成为【司机】的专业生产工具(这也解释了为什么理想的VLA叫做司机大模型)
理想汽车的研发体系之下,VLA也有三个进化的过程:
第一阶段,依赖规则算法和高精地图的辅助驾驶,类似“昆虫动物智能”。
第二阶段,端到端+VLM(Vision Language Model,视觉语言模型)辅助驾驶,接近“哺乳动物智能”。
第三阶段,在端到端的基础上,拥有完整的脑系统,具备语言、CoT(Chain of Thought,思维链)推理能力,既能看,也能理解并真正执行行动,符合人类的运作方式。
而这几个阶段的训练过程也分为预训练、后训练和强化训练三个环节,类似于人类学习驾驶技能的过程。在最后的强化训练环节,目标是让VLA司机大模型更加安全、舒适,对齐人类价值观,甚至超越人类驾驶水平。
不过李想今晚也提到,在在辅助驾驶方面,由于英伟达Orin-X芯片无法直接运行语言模型,端到端+VLM的辅助驾驶方案对部分企业来说还是很有挑战的。但是,大型企业的基本功和能力永远无法被逾越。
不知道这里面的“大型企业”,大家能想到多少位[并不简单]
还有几个有意思的提问和回答也挺有意思的:
Q:怎么看待特斯拉FSD进入了中国?
A:FSD的基本功是非常扎实的,他们大概在用12.5之前的模型,这个模型并不是特斯拉真实能力,距离特斯拉真实能力还有巨大的差距。
Q:关于星环OS的开源?
A:得益于DeepSeek的开源,理想汽车在VLA司机大模型的研发上得到了巨大的收益和帮助,所以我们在想我们能对社会做点什么贡献,所以我们就把自研的整车操作系统星环OS给开源了。
Q:理想汽车十周年有什么想法?
A:创业确实不容易,我还是尽可能保留那些有价值的美好片段,企业遭遇的打击必须要面对,也正是这些挑战,赋予了理想汽车更多的能力。
李想谈辅助驾驶到了新十字路口大v聊车