DeepSeek低调升级V3模型:编码能力显著提升,聊天语气更像人类

程序员咋不秃头 2025-03-28 02:18:20

即使今晚没有等来R2,也至少没有白等。

北京时间3月24日晚,深度求索(DeepSeek)突然推送了DeepSeek-V3模型升级版(V3-0324),有趣的是,他们依然延续了其「静默更新」的技术迭代的风格。

InfoQ从DeepSeek官方微信群获悉,新模型已通过网页端、App及小程序全面开放。

尽管并非传闻中的V4或R2版本,但此次更新凭借6850亿参数的开源模型和针对性优化,迅速引发全球开发者社区关注。

初代V3模型曾以557.6万美元训练成本媲美Claude 3.5效果的极致性价比震惊业界,而此次升级后的新版模型上线几小时内就吸引了大量开发者自发测试。

虽然DeepSeek尚未放出官方测试结果,但据Reddit平台上已经测试过新版模型的用户反馈,新版模型编码能力较之前有明显提升,对JavaScript、TypeScript等语言的代码补全和错误检测表现尤为突出,被开发者称为「感知最强升级」。

还有体验过的用户表示,新版本与其他版本的区别是对话时的语气、用词更像人类。

而更多的用户则表示仅仅放出来个小版本更新不够过瘾,期待早日见到R2。

凭借初代V3发布时「唯一冲入Chatbot Arena前十的开源模型」的辉煌战绩,开源网站显示,其6850亿参数版本已提供完整权重下载,预计将显著降低企业AI应用门槛。

0 阅读:0