苹果公司加速人工智能研发:新机型能做什么

省钱田田 2024-07-27 10:35:08

国际快递 · 清关 · 代拍

海外古董 · 艺术品 · 名画 · 名表

【FuninUSA.NET综合报道】尽管苹果公司最初迟迟没有进入人工智能领域,但在苹果全球开发者大会之后,该公司已全力投入人工智能领域。Apple Intelligence将为苹果公司几乎所有的产品提供人工智能解决方案,而且该公司不会止步于此。相反,苹果现在正进一步进军人工智能语言模型领域。

上周四,苹果在Hugging Face上发布了一个70亿参数的语言模型DCLM-Baseline-7B。该模型是语言模型DataComp(DCLM)基准的一部分,DCLM是一项旨在提高语言模型训练数据集质量的计划。

该模型有70亿个参数,可与Llama 2、Gemma等流行模型相媲美。在大规模多任务语言理解(MMLU)基准测试中,DCLM-Baseline-7B与同等规模的流行模型进行了比较,其表现极具竞争力,甚至超过了Mistral 7B,如下所示。

正如苹果公司研究科学家Vaishaal Shankar所强调的那样,尽管DCLM-Baseline-7B的性能令人印象深刻,但其最大的亮点之一是该模型真正实现了开源,即“开放数据、开放权重模型、开放训练代码”。

我们在huggingface上发布了DCLM模型!据我们所知,这是迄今为止性能最好的真正开源模型(开放数据、开放权重模型、开放训练代码)1/5

- Vaishaal Shankar(@Vaishaal) 2024年7月18日

许多人对苹果的这种做法表示赞赏,因为它允许其他研究人员和开发人员在模型的基础上进行开发,进一步推动该领域的发展。该模型在DCLM-BASELINE数据的基础上,结合StarCoder和ProofPile2数据进行了训练,以达到熟练掌握编码和数学等其他任务的能力。

除了发布DCLM-Baseline-7B、模型权重、训练代码和数据集之外,苹果还在软件包中加入了功能强大的14亿参数版本。

这并不是苹果第一次使用人工智能模型,此前苹果还发布了多模态大型语言模型(MLLM)Ferret-UI 和对话式人工智能系统 Reference Resolution As Language Modeling(ReALM)。秋季,当iOS 18和苹果智能系统(Apple Intelligence)上市时,我们就能看到苹果在人工智能领域的竞争,并更好地衡量其人工智能努力的潜在成功。

欢迎到FuninUSA.NET论坛讨论

0 阅读:1

省钱田田

简介:感谢大家的关注