deepseek以远低于OpenAI的成本实现了水平相当的功能,这也让deepseek一跃成为AI大模型的明星。没有最低,只有更低,是亘古不变的真理。你用500万能做出来,我用50万也能做出来,这我相信。但号称50美元就能训练出媲美deepseek和OpenAI的大模型,还是差点儿惊掉了我的下巴。
仔细搜寻相关资料才恍然大悟,如果都是这样不要脸,明天我都敢说5块人民币也要先进的大模型,反正只要不要脸,猪都能飞上天。从后来爆出来的资料看,这50美元的训练数据是精选的,训练过程是在阿里通义千问大模型上监督微调的。最后的成品只是一篇论文,这能说明什么?不知道这样的训练除了吸人眼球还有什么价值?

突然想到冯小刚电影《大腕》李成儒的那段台词:OpenAI就好比是李成儒嘴里的开发商,重金打造了美轮美奂的高档住宅;deepseek就好像是众筹建房的团体,注重实用而非追求奢华。最后房子户型面积等都差不多,但成本却相差巨大。而这50美元的就好比找了一个摄影师到人家的房间里拍了一段视频,就号称是自己开发的,真的是一点儿脸都不要了。
