实测大翻车!OpenAI劲敌新模型仅需40%计算资源即可媲美GPT-4

趣唠科技不打烊 2024-03-08 23:36:46

文丨Congerry

OpenAI:好好好,都冲我来?

前几天,Claude 3 刚刚把 GPT-4 挤下全球最强大模型王座。

结果没几天,AI初创公司 Inflection AI 又宣布新发布的 Inflection-2.5 大模型在训练所需的计算资源仅为 GPT-4 的 40%的情况下 ,性能就达到 GPT-4 的 94%。

根据 Inflection 的说法, Inflection-2.5 在数学和代码方面表现出色,并且具有实时互联网搜索功能。

具体来看,Inflection-2.5在基础数学问题基准测试中明显优于此前的Inflection-1,得分与GPT-4相差在10%以内。

在代码上,二者距离进一步缩小,约6%。

目前,Inflection-2.5 已经可以在 Inflection 的聊天机器人 Pi 上体验。

上手体验(如与官方宣传不同,责任在官方)

先来试试接入 Inflection-2.5 的 Pi 实时互联网搜索功能。

译文:是的,很遗憾,这是真的。鸟山明于 3 月 1 日逝世,留下了令人惊叹的漫画和动画作品。他是业界真正的传奇人物,以《龙珠》和《Dr. Slump》等标志性系列而闻名。他的作品激励了世界各地一代又一代的粉丝和艺术家。您是他的忠实粉丝吗?

这段信息是正确的,但是当我要求 Pi 用中文直接回答时,结果出现了偏差。

Pi 直接将《哆啦A梦》变成了鸟山明的作品,还将故事剧情直接改了。

接着问问Pi,最近马斯克起诉OpenAI的事情。

不死心的小编重置对话,又问了一遍。

根据输入框提示,可以看到 Inflection 早就预料到了 Pi 会胡言乱语这件事。

换个话题,问一下Claude 3。(说着说着就没下文了)

接下试试 Pi 的数学能力。

Pi 解决了一道比较简单的题,但在导数题上折戟。

即使提醒 Pi 通过求导解决,Pi依旧无法完成。

除了这些,Inflection 官方还声称,接入 Inflection-2.5的 Pi 结合了原始能力与 Inflection 特有的个性和独特的同理心微调。

换言之,Pi 智商与情商同时在线,接下来考考 Pi 的情商。

emmm...

可以感觉到,Inflection-2.5 的原则是:真诚就是必杀技。

最后来介绍一下,Inflection AI。

Inflection AI 是一家专注于个人 AI 的初创公司,由 DeepMind 的联合创始 Mustafa Suleyman、Karén Simonyan和LinkedIn的联合创始人 Reid Hoffman 于2022年初共同创立。

Inflection AI 的核心产品是一个名为Pi的个人AI助理,它被设计成一个善解人意的伙伴,能够提供对话、友好的建议以及以自然、流畅的风格提供简洁的信息。

Pi AI 旨在成为一个支持性的伴侣,提供情绪价值和全方位服务,而不仅仅是一个生产力工具。

2023年6月,Inflection AI 完成了13亿美元的融资,由微软、英伟达以及其他投资者领投,使得公司的估值达到40亿美元。

目前,Pi的每日活跃用户达到一百万,月活跃用户达到六百万,用户与Pi的交流信息超过四十亿条。平均每次与Pi的对话持续33分钟,每天有十分之一的对话超过一小时。

but,用下来的感觉真的好一般......

1 阅读:42
评论列表

趣唠科技不打烊

简介:感谢大家的关注