微软将“欧洲OpenAI收入麾下”!新发布旗舰模型性能直逼GPT-4

趣唠科技不打烊 2024-02-27 21:44:57

文丨Congerry

估值 20 亿欧元(约合 156 亿元人民币)的欧洲“OpenAI”也被微软收入麾下了。

2月26日,法国的人工智能初创公司 Mistral AI 宣布推出新 AI 模型Mistral Large和聊天机器人Le Chat。Mistral AI 声称,Mistral Large 具有顶级推理能力,可用于复杂的多语言推理任务,包括文本理解、转换和代码生成。

在广泛采用的基准测试中,Mistral Large 表现突出,成为全球通过API可访问的排名第二的模型,仅次于GPT-4。谷歌的Ultra模型能力更强,但尚未普遍通过API提供。

而且,与GPT-4 Turbo相比,Mistral Large 的成本还降低了大约20%。

趁着 Mistral AI 新品发布,微软宣布与 Mistral AI建立新的长期合作伙伴关系。根据路透社报道,微软发言人表示:“我们已经向 Mistral AI 投资了 1500 万欧元,这笔投资将在该公司下一轮融资中转换为股权。”

值得一提的是,与 Mistral 之前推出的 Mixtral 8x7B 系列模型不同(开源大模型性能持平GPT-3.5!初创公司再获巨额融资,成立仅7个月估值20亿美元),Mistral Large 不会开源。

Abacus.AI 的联合创始人兼首席执行官Bindu Reddy表示,不骗你,我对Mistral没有开源他们的任何模型感到难过我以为他们是支持开源的团队。

看到网友在评论区贴上微软入股 Mistral AI 之后,马斯克辣评:“微软是否要让它们成为闭源产品?”

仅次于GPT-4,Mistral AI 基准测试表现优秀

根据 Mistral AI 的说法,Mistral Large 模型具有的新能力和优势包括:

多语言流利度:Mistral Large能够像母语使用者一样流利地处理英语、法语、西班牙语、德语和意大利语,并且对这些语言的语法规则和文化背景有深入的理解。大文档信息处理:该模型具有32K tokens的上下文窗口,它可以处理大量文本信息,并从中精确地调用信息。精确执行指令:Mistral Large能够精确地遵循开发者给出的指令,这使得开发者可以根据需要定制内容审查政策。原生函数调用能力:Mistral Large支持函数调用,这是编程中的一个高级特性,允许模型执行复杂的任务。结合la Plateforme(Mistral AI的平台)上实施的输出内容限制模式,这一能力促进了应用程序的开发和技术栈的现代化。

Mistral AI 没有提供 Mistral Large 的具体参数,但将其性能与常用基准上领先的 LLM 模型进行了比较。

推理和知识

Mistral Large在一系列常识和推理知识基准测试中的整体表现优于 LLaMA 2 70B 和GPT 3.5,并且在大多数测试中接近或超过了GPT 4。

多种语言能力

在法语、德语、西班牙语和意大利语的 HellaSwag、Arc Challenge 和 MMLU 基准测试中,Mistral Large 的性能远远超过 LLaMA 2 70B。

数学和编码

Mistral Large 在编程和数学任务上的表现优于LLaMA 2 70B和GPT 3.5。

优化 Mistral Small,Mistral AI 抢 OpenAI 蛋糕

除了Mistral Large之外,Mistral AI 还发布了一个新的优化模型Mistral Small,专为低延迟工作负载而优化。值得一提的是,Mistral Small是开源的。

Mistral Small 的性能优于之前的 Mixtral 8x7B 模型,并且延迟更低,作为一个中间方案,介于Mistral AI的开源重量级产品和旗舰模型Mistral Large之间。

Mistral Small继承了Mistral Large的创新特性,包括RAG(检索增强生成)功能和函数调用能力。

Mistral AI 还简化了其端点产品线,提供了具有竞争力定价的开源重量级端点。

其中,Mistral Large输出一百万tokens要24美元,GPT-4 Turbo为30美元/1M tokens,算下来Mistral Large 比 GPT-4 Turbo 便宜 20%。

不过 GPT-4 Turbo还提供了128k的上下文窗口,这比 Mistral Large 的32k上下文窗口更大。而且 Mistral Large 的性能对标 GPT-4 仍有距离,20%的价格差看起来诱惑力或许并没有想象中那样大。

另外,Mistral AI 这次还推出了自己的聊天机器人Le Chat,只不过目前需要加入等待名单。

微软投资OpenAI竞品

根据 Mistral AI 创始人 Arthur Mensch 接受《华尔街日报》采访时透露,Mistral Large的训练成本不到 2000 万欧元,相当于大约 2200 万美元。

相比之下,Sam Altman去年在 GPT-4 发布后表示,该公司最大模型的训练成本 "远远超过 "5000 万至 1 亿美元。

业界正密切关注Mistral公司的动向,该公司不仅吸引了众多企业客户的兴趣,还获得了投资者的青睐,其中就包括OpenAI的金主微软。

微软公司于本周一宣布,计划将其Azure云服务平台扩展,纳入Mistral公司开发的新型模型,为开发者提供更多选择。作为双方多年合作协议的一部分,微软将持有Mistral公司的少数股份。

这是微软为其 Azure 客户提供 OpenAI 替代方案的最新例子。2023年,微软曾与 Cohere 达成了类似的协议。

当时,微软扩展了 Azure 云平台的能力,允许客户访问并使用不仅仅是 OpenAI,还包括 Meta Platforms、Mistral 和 Cohere 等公司开发的开源和专有的大型语言模型(LLM)。、

不过坏消息是,这笔交易在布鲁塞尔引起了关注。在欧盟广泛的 AI 法案谈判过程中,Mistral AI 曾游说要求对某些模型的规则放宽,其支持者警告说,严格的规则可能会削弱欧洲公司与大型科技公司竞争的能力。

根据路透社报道,欧盟委员会在周二表示,他们将分析微软与 Mistral 的交易,作为对大型科技公司 AI 合作伙伴关系持续审查的一部分。欧盟执行机构此前警告说,微软对美国 OpenAI 的支持可能受到欧盟并购法规的约束。

负责起草欧盟里程碑式 AI 法案的欧洲议会成员 Brando Benefei 表示:“正在浮现的情况更加表明,我们没有在合法但强烈的游说下,像 Mistral 这样的公司,削弱我们对具有系统性风险的 GPAI(通用目的 AI)模型安全性的雄心,这是件好事。这个故事需要进一步调查。”

Mistral AI 团队介绍

让人非常惊讶的一件事情是,Mistral AI 成立于2023年4月,到现在仅10个月的时间。

Mistral AI 创始人包括 Arthur Mensch、Guillaume Lample 和 Timothée Lacroix。

在共同创立 Mistral AI 之前,Arthur Mensch 曾在Google 的人工智能实验室Google DeepMind工作,而 Guillaume Lample 和 Timothée Lacroix 则在Meta Platforms工作。

Mistral AI 联合创始人:Guillaume Lample、Arthur Mensch、Timothée Lacroix

在 DeepMind 工作期间,Arthur 是 Retro、Flamingo 和 Chinchilla 项目的主要贡献者,Guillaume 与 Timothée 则是一起领导了Meta LLaMa 大型语言模型的开发。

Arthur Mensch说,"我一直为欧洲没有大型科技公司而感到遗憾。我认为这是我们成为大科技公司的机会。“

2023年年初,30 岁的 Arthur Mensch 与 32 岁的Timothée Lacroix 和 33 岁的 Guillaume Lample 携手合作试图找到更高效的方法来构建和部署人工智能系统,从而战胜硅谷巨头。

2023年6月,这家初创公司进行了首次融资1.05亿欧元(1.17亿美元),投资者包括美国基金Lightspeed Venture Partners、Eric Schmidt、Xavier Niel和JCDecaux。据《金融时报》估计,估值为 2.4 亿欧元,约合 2.67 亿美元。

2023 年 12 月 10 日,Mistral AI 宣布已筹集 3.85 亿欧元(4.28 亿美元),作为第二次融资的一部分。此轮融资主要涉及加州基金Andreessen Horowitz、法国巴黎银行和软件发行商Salesforce。

对于Arthur和他的联合创始人来说,将他们最初的人工智能系统作为开放源代码发布,任何人都可以免费使用或改编,这是一个重要的原则。这也是一种让开发者和潜在客户关注的方式,他们渴望对自己使用的人工智能有更多的控制权。

对于Mistral Large没有开源的争议,Mensch 回应:“在建立商业模式和坚持我们的开源价值观之间,这显然是一种微妙的平衡,我们希望发明新的东西、新的架构,同时我们也希望有额外的东西卖给我们的客户。”

0 阅读:0

趣唠科技不打烊

简介:感谢大家的关注