突发!DeepSeek下周将陆续开源5个项目

聚焦芯球 2025-03-12 02:42:24

刚刚!DeepSeek宣布,下周起将连续5天开源5个项目,每天都有新内容发布。目前,其在线服务模块已完成测试并部署完备,可投入生产环境。

DeepSeek在人工智能领域一直表现亮眼,此前推出的模型取得了不错的成绩。例如,DeepSeek V3是混合专家(MoE)语言模型,总参数达6850亿 ,其中6710亿是主模型权重,140亿是多令牌预测(MTP)模块权重。训练成本仅550万美元,在代码竞赛平台Codeforces的编程竞赛中,成绩超过了Meta的Llama 3.1 405B、OpenAI的GPT-4o和阿里巴巴的Qwen 2.5 72B等模型。

这次DeepSeek集中开源5个项目,有望进一步推动人工智能领域的技术交流与创新,为开发者提供更多可使用和改进的资源。

0 阅读:0

聚焦芯球

简介:感谢大家的关注