近日,一条炸裂消息引发很多国人焦虑!6月27日,美国OpenAI宣布将从7月9日开始禁止中国地区开发者获取OpenAI的工具和软件。
该消息在网上激起一大波恐慌情绪!但很快这种恐慌情绪迅速被惊喜所代替,从国外传回来的一个好消息让国内外从业者认清中国AI大模型的真正实力。
6月27日,全球著名权威开源平台huggingface的联合创始人兼首席执行官Clem宣布了重磅消息,来自中国的阿里最新开源Qwen2-72B指令微调版本,拿到其开源模型排行榜第一名,超越了科技、社交巨头Meta的Llama-3、法国著名大模型平台Mistralai的Mixtral。
此次,阿里Qwen-2 72B斩获的第一份量极重,因为huggingface不仅是目前全球大模型领域最具权威性的榜单,同样是全球前沿大模型研发水平的重要体现。
更振奋人心的是,这已经不是国产大模型第一次登顶huggingface榜单。今年6月7日,阿里推出开源模型Qwen2-72B之后,HuggingFace显示Qwen2-72B登上了开源大模型榜单榜首,性能超过美国最强的开源模型Llama3-70B,成为全球性能最强的开源模型。
据悉,这次的榜单是V2榜单,是HuggingFace一年来首次全面更新的版本。此前,市面上流行五花八门的大模型榜单,但由于基准指标被过度使用或错误、评估流程简单等原因,这些榜单的“水分”很大。
为了对模型性能考察均更具说服力,HuggingFace提出了更有挑战性的V2榜单,基于未受污染、高质量数据集的新基准,运用可靠的度量标准,考察大模型的知识测试、短文本和长文本的理解推理、复杂的数学能力,以及与人类偏好高度相关的任务如指令遵循,通过使用了300块H100对目前全球100多个主流开源大模型在B BH、MUSR、MMLU-PRO、GPQA等基准测试集上进行了全新评估,覆盖了Qwen2、Llama-3、mixtral、Phi-3等最强选手,可谓世界大模型的“华山论剑”。
最终,无论老榜单,还是新的V2榜单,阿里的Qwen2-72B都毫无悬念地成为王者。此外,在V2榜单排名前10的大模型中,阿里占到4席,差不多拿下半壁江山。
不光阿里Qwen2-72B指令微调版本拿到全球第一,阿里的Qwen2-72B基础版本排名第3,而第9和第10名,全部都是阿里之前开源的Qwen1.5基础和Chat版本。反观西方,Meta开源的Llama-3-70B指令微调版本位列第2,Mistralai的Mixtral-8x22B指令微调版本排名第4,两相对比之下,充分体现出中国对全球开源大模型的重要贡献以及领导地位!
封禁让OpenAI彻底不Open,但对中国大模型而言却是前所未有的机遇。其实中美大模型差距并没有那么大,如今阿里等头部公司已经掌握核心开源大模型技术,随着市场扩大以及AI普及,OpenAI退出反而倒逼中国大模型加速进步!