幻方量化旗下的DeepSeek(深度求索)在2024年年末成为了全球AI行业的焦点,他们刚刚发布的开源大模型DeepSeek-v3用更低的参数、更少的成本、更短的时间,在能力上却可以媲美OpenAI的GPT-4o。如此反常的表现自然是一石激起千层浪,让整个业界开始讨论起了这个“神秘的东方力量”。
因此“国产大模型之光”的头衔也被好事者戴在了DeepSeek-v3头上,可人红是非多,日前有用户发现,在向DeepSeek-v3提问“你是哪家大模型”时,DeepSeek-v3竟然会称自己是ChatGPT。考虑到这一次DeepSeek-v3的训练成本仅为557.6万美元,使用的GPU也只有2048块,如此低的成本却有着惊人的效果,难免就会有人怀疑它是ChatGPT套壳。
事实上,当下大模型的迭代是建立在海量投入的基础上。根据技术咨询公司Omdia的分析师估计,微软方面在2024年购买了48.5万块英伟达Hopper芯片,接下来则是买了22.4万块Hopper芯片的Meta,xAI、亚马逊,即便谷歌购买的芯片也在六位数。也正是各大厂商的疯狂投入,使得英伟达的市值攀上了全球第一的宝座。
不仅如此,为了保障AI大模型训练所需要的能源,谷歌、微软等巨头甚至盯上核能,开启了投资核电站的热潮。更加致命的是,大模型训练的“高举高打”模式甚至开始失灵,根据相关爆料显示,OpenAI的GPT-5开发进度已落后原计划半年,其每轮训练需要耗费数周、乃至数月时间,六个月的计算成本可能达到了5亿美元。
业界领头羊OpenAI的核心项目出现问题,自然就更显得DeepSeek-v3以小博大的特殊性。当然,DeepSeek-v3并非第一个出现自我认知错误的大模型。此前在去年年末,谷歌的Gemini就出现过自称百度文心一言的情况,马斯克旗下xAI推出的AI聊天机器人Grok也曾在与用户对话时突然表示,“我无法完成您的请求,因为它违反了OpenAI的用例政策。”
显而易见,DeepSeek-v3自称是ChatGPT的现象并非孤立。那么问题就来了,为什么大模型会出现如此低级的错误,难道证明了“算力极限会制约大模型演进”是一个伪命题的DeepSeek-v3,其实是建立在套壳ChatGPT的基础上?当然不是,毕竟DeepSeek-v3在大多数基准测试中都比GPT-4o的表现更好,单纯的抄袭显然也做不到青出于蓝而胜于蓝。
事实上,DeepSeek-v3出现自称ChatGPT的认知错位,源自于AI输出的内容已经在互联网泛滥。从2023年开始,就已经有大量出版机构、网站开始使用AI来撰写文章,随着AI产出的内容大量出现,任何一家大模型厂商使用的数据集都无法避免会被AI污染,其中ChatGPT输出的内容必然就是最多的。
在2022年年末上线的ChatGPT,是史上增长最快的消费类应用程序,时至今日其仍以超3亿月活遥遥领先于一众竞品。如此庞大的活跃用户群体,就意味着ChatGPT已经在事实上成为了互联网新的内容源。即便DeepSeek或其他大模型厂商并未通过“蒸馏”ChatGPT来获得数据,也做不到完全摆脱ChatGPT的影响。
当初谷歌Gemini自认为是文心一言,其实也是同样的道理。彼时Gemini自称文心一言只会发生在中文对话场景,切换到英文就不会复现,其中的关键就在于百度实际上掌握有全网规模最大、质量最高的中文语料库,所以不使用百度的数据几乎没有训练好AI中文能力的可能。
归根结底,DeepSeek-v3自称ChatGPT当然也不是一件好事。它的出现代表着即使是DeepSeek-v3这种基于合成数据完成自我迭代的模型,在左脚踩右脚实现原地升天的情况下,也无法在训练数据集中彻底清洗AI产出的内容。
换而言之,未来大模型厂商将不得不在AI内容的基础上进行产品迭代,各个大模型自我认知混乱的情况也会进一步加剧,这次DeepSeek-v3自称ChatGPT可能仅仅只是一个开始。