国产AI自称ChatGPT，真相可能和你想的不一样

幻方量化旗下的DeepSeek（深度求索）在2024年年末成为了全球AI行业的焦点，他们刚刚发布的开源大模型DeepSeek-v3用更低的参数、更少的成本、更短的时间，在能力上却可以媲美OpenAI的GPT-4o。如此反常的表现自然是一石激起千层浪，让整个业界开始讨论起了这个“神秘的东方力量”。

因此“国产大模型之光”的头衔也被好事者戴在了DeepSeek-v3头上，可人红是非多，日前有用户发现，在向DeepSeek-v3提问“你是哪家大模型”时，DeepSeek-v3竟然会称自己是ChatGPT。考虑到这一次DeepSeek-v3的训练成本仅为557.6万美元，使用的GPU也只有2048块，如此低的成本却有着惊人的效果，难免就会有人怀疑它是ChatGPT套壳。

事实上，当下大模型的迭代是建立在海量投入的基础上。根据技术咨询公司Omdia的分析师估计，微软方面在2024年购买了48.5万块英伟达Hopper芯片，接下来则是买了22.4万块Hopper芯片的Meta，xAI、亚马逊，即便谷歌购买的芯片也在六位数。也正是各大厂商的疯狂投入，使得英伟达的市值攀上了全球第一的宝座。

不仅如此，为了保障AI大模型训练所需要的能源，谷歌、微软等巨头甚至盯上核能，开启了投资核电站的热潮。更加致命的是，大模型训练的“高举高打”模式甚至开始失灵，根据相关爆料显示，OpenAI的GPT-5开发进度已落后原计划半年，其每轮训练需要耗费数周、乃至数月时间，六个月的计算成本可能达到了5亿美元。

业界领头羊OpenAI的核心项目出现问题，自然就更显得DeepSeek-v3以小博大的特殊性。当然，DeepSeek-v3并非第一个出现自我认知错误的大模型。此前在去年年末，谷歌的Gemini就出现过自称百度文心一言的情况，马斯克旗下xAI推出的AI聊天机器人Grok也曾在与用户对话时突然表示，“我无法完成您的请求，因为它违反了OpenAI的用例政策。”

显而易见，DeepSeek-v3自称是ChatGPT的现象并非孤立。那么问题就来了，为什么大模型会出现如此低级的错误，难道证明了“算力极限会制约大模型演进”是一个伪命题的DeepSeek-v3，其实是建立在套壳ChatGPT的基础上？当然不是，毕竟DeepSeek-v3在大多数基准测试中都比GPT-4o的表现更好，单纯的抄袭显然也做不到青出于蓝而胜于蓝。

事实上，DeepSeek-v3出现自称ChatGPT的认知错位，源自于AI输出的内容已经在互联网泛滥。从2023年开始，就已经有大量出版机构、网站开始使用AI来撰写文章，随着AI产出的内容大量出现，任何一家大模型厂商使用的数据集都无法避免会被AI污染，其中ChatGPT输出的内容必然就是最多的。

在2022年年末上线的ChatGPT，是史上增长最快的消费类应用程序，时至今日其仍以超3亿月活遥遥领先于一众竞品。如此庞大的活跃用户群体，就意味着ChatGPT已经在事实上成为了互联网新的内容源。即便DeepSeek或其他大模型厂商并未通过“蒸馏”ChatGPT来获得数据，也做不到完全摆脱ChatGPT的影响。

当初谷歌Gemini自认为是文心一言，其实也是同样的道理。彼时Gemini自称文心一言只会发生在中文对话场景，切换到英文就不会复现，其中的关键就在于百度实际上掌握有全网规模最大、质量最高的中文语料库，所以不使用百度的数据几乎没有训练好AI中文能力的可能。

归根结底，DeepSeek-v3自称ChatGPT当然也不是一件好事。它的出现代表着即使是DeepSeek-v3这种基于合成数据完成自我迭代的模型，在左脚踩右脚实现原地升天的情况下，也无法在训练数据集中彻底清洗AI产出的内容。

换而言之，未来大模型厂商将不得不在AI内容的基础上进行产品迭代，各个大模型自我认知混乱的情况也会进一步加剧，这次DeepSeek-v3自称ChatGPT可能仅仅只是一个开始。

玩酷网

国产AI自称ChatGPT，真相可能和你想的不一样

三易生活