夕小瑶科技说 原创作者 | 付奶茶
家人们,就在今天,Mistral 7B发布一周年之际,小模型的宝座又易主了!
Mistral研究团队发布了两款新的边缘计算小模型:Ministral 3B 和Ministral 8B,统称为“les Ministraux”(小部长们),小部长模型们主要适用于设备端计算和边缘计算场景。
团队很自豪的宣称“Introducing the world’s best edge models”,认为他们做到了最好的边缘计算模型!
官方链接:https://mistral.ai/news/ministraux/
咱们看图说话,可以看到与10B以下的模型相比,其推理能力、常识和效率都取得了明显的进步!
研究出发的动机研究团队提出,现在合作伙伴越来越重视隐私,需要在本地进行隐私优先的推理,以支持关键应用:比如设备上的翻译、无需互联网的智能助手、本地分析和自主机器人技术等,而小部长们的出生就是为了满足这样的需求~
因此,当与更大的语言模型(如Mistral Large)结合使用时,小部长模型们扮演着多步骤智能工作流程中的高效中介角色。
它们能够进行定制,以极低的延迟和成本执行输入解析、任务路由,并根据用户意图在多种上下文中调用API。这种灵活性使得小部长模型们能够适应从独立爱好者到全球制造团队的各种应用需求,具有广泛的适用性和专业性。
小部长们作为引导模型(Instruct Model)的表现相较于其他也遥遥领先:
小而美真的来了!在一系列与 Gemma 2 2B、Llama 3.2 3B、Llama 3.1 8B 和 Mistral 7B 的基准测试中,Ministral小部长模型们的表现都很出色,
无论是在预训练模型还是指令模型的评估中,相较于类似规模的小模型,展现了卓越性能。
最精彩的是,Ministral 3B小部长,尽管规模相比来说更小,但在多数基准测试中显著超越了更大的Mistral 7B!
定价不贵目前,这两个小部长模型都可以使用了,定价如下:
Ministral 8B:每百万token收费 0.1 美元Ministral 3B:每百万token收费 0.04 美元支持私有部署,而且,Ministral 8B的Instruct模型权重也已经开放下载~
结语研究团队发了下面忍者神龟的meme,说Mistral 7B发布才一年,但是就在今天,哪怕是最小的模型(小部长3B)就已经大多数基准上的性能已经超过了它:
岁月不饶人啊,。。。不过,3B小部长的成功也揭示着,随着技术的进步,AI的"小而美"时代正在到来~