语言模型的文字生成能力,与对物理世界的理解和判断力之间的鸿沟,就是AI和AGI的真实距离;智能和智慧之间,天壤之别
文/智物
豆包大模型非常言之凿凿地回复,“世纪华通确实投资了DeepSeek公司。”并且,列举了具体情况:2023年11月,世纪华通通过旗下盛趣科技与砾思集团合作成立的砾锋投资,战略投资了深度求索(DeepSeek),成为其重要股东。
豆包大模型列举该信息是来自7个搜索来源,全部来自两个股票社区用户贴文,其中一条信息已经被删除,另外一条信息在提豆包回答的具体情况的时候,在句末括号中表述,自己的信息来自于豆包大模型。
问题是,有多少人会相信豆包大模型的回答,豆包大模型是否需要在醒目之处告诉用户,它真实能力的局限。
真假极其容易辨别。工商查询工具清晰地列出了DeepSeek软件背后公司的股东信息,杭州深度求索人工智能基础技术研究有限公司只有两个股东,创始人梁文锋之外,99%的股份由有限合伙企业宁波程恩持有。

语言模型巧舌如簧,只是没有智能
宁波程恩的股权又由梁文锋和另外两家有限合伙企业,宁波程信柔兆和宁波程普商务持有,这两家有限合伙企业的股东穿透过去全是自然人,应该是深度求索公司的员工和关联人。
更有意思的是,砾思集团、砾锋投资的相关信息在工商查询工具,根本无法检索到。主要的搜索引擎上,关于这两个公司和世纪华通之间的关联,也全是来自豆包所提到的社区内容。
豆包大模型似乎并不知道去做基本事实的核实。对于同样的一个问题,出状况的并非只有豆包,大模型之祖ChatGPT也清楚地回答:是的。ChatGPT也列出了与豆包列举的类似的事实,只是不像豆包直接拷贝社区的文字内容,而是对几条信息做了综合。
ChatGPT也列举了自己的信源。
谷歌的Gemini回答说无法判断。Gemini列举了世纪华通的公司介绍,语言和豆包大模型非常类似,相信它也“看到”了类似的信源。不知道为什么,Gemini没有采信两个股票用户社区的用户帖文。
Gemini有一个特色之处,是它在文本生成时的核查能力,和核查提醒。这和谷歌公司此前信息搜索结果的谨慎态度有极大的关系,毕竟这家搜索引擎巨头在信息结果展示方面,独特的原则和坚持,赢得过用户的赞许,也引来过巨大的争议。
谷歌有这方面的经验。
DeepSeek自己的回答,更加离谱,表面看它也认为无法判断世纪华通和DeepSeek之间的股权关系,看似接近准确。但是,DeepSeek将自己创始人的名字,错误地写成了另外一个计算机科学天才陈天奇,也就是备受瞩目的MXNeT开源项目的负责人。
如今,陈天奇远在美国芝加哥,创立了另外一家AI公司。
DeepSeek坚持认为,DeepSeek官网的about us页面,以及某些投资信息当中有创始人陈天奇的内容。并且,很生动地联想到,因为腾讯是世纪华通的大股东,同时,腾讯、红杉投资了Deep Seek,也许世纪华通和DeepSeek之间有股权关系。
故事精彩,想象能力丰富,可惜并不是真的。公开信息当中,陈天奇新公司OctoML的投资人当中,有A16Z、NEA和英特尔,但是没有红杉和腾讯。