免费的GPT-4o来了“贾维斯”走进现实?

海凡资本 2024-05-15 02:59:23

海闻社讯 北京时间5月14日凌晨1点,世所瞩目的OpenAI举行春季发布会,智能语音助手成为了继“文生视频模型”Sora之后又一个惊喜。

公司首席技术官米拉·穆拉蒂(Mira Murati)向外界展现了多项与chatgpt有关的更新:

新的UI、新的文字语音视频综合模型GPT-4o与新的GPT-4o API。

海闻君看完了整个直播全程,真的被震撼到了,GPT-4o可以用三个关键词概括。

免费

是的,你没看错,免费。对吃瓜群众来说,免费是最大的诱惑。

不仅仅是基础的GPT文字对话功能,过去只有Plus用户才能拥有的GPTS,browring、图像理解、代码解析器等功能全免费,仅仅对5X标准用量以上才进行收费。

除此之外,新公布的GPT-4o API也在更强大的功能下只需要半价。

这要同赛道玩家们怎么卷?不知道全球的GPT-4追赶方们现在是怎么个心理状态。

强大

新的GPT-4o在各方面都拥有了更强大的能力。

比如搜索。前几天要开发新AI搜索引擎的传言让谷歌股价剧震。虽然传言落空谷歌修复跌幅,但UI内置的搜索功能依然有了更出色的检索归纳能力。

新的GPT-4o API也提供了128K上下文两倍快速度的服务,并给予五倍访问限制。

颠覆性

此次更新中,最颠覆性的是GPT-4o甚至满足了一些超现实幻想——比如,让《钢铁侠》中托尼史塔克的人工智能助手“贾维斯”降临现实。

米拉·穆拉蒂称完全不用担心GPT-4o在实时语音和音频功能方面的安全和隐私,这一切都将得到保障。更多更有趣的功能也将在接下来的更新中逐步推出。

直播中他们向观众们展示了这个奇迹一般的进步,OpenAI研究主管Mark Chen掏出手机打开ChatGPT,用语音模式直接通过对话向现场演示。

交流没有恼人的加载延迟,几乎是瞬间他就接过了你的话题,并且你能像和朋友交谈那样时而打断它。如果你是一个“社交恐怖分子”,你一定很擅长根据不同的场景切换不同的音色来营造诙谐的气氛,比如夹子音撒娇,变调说怪话调侃。是的,这些它也能做到。

GPT在演示中交谈就像一位典型的美国年轻女性,它听到Chen密集的喘息声后甚至觉察到了它紧张的情绪。它说“Mark,你不是吸尘器”,并告诉Mark如何放松呼吸。

OpenAI的后训练团队负责人Barret Zoph还演示了GPT如何充当一个实时的数学老师。他在白板上写了一个方程式3x+1=4,ChatGPT能够一步步引导他做题,通过摄像头识别他的书写结果,并帮助他自己解出X的值,而不仅仅是直接生成这道题的答案。

不仅如此,米拉·穆拉蒂现场还要求ChatGPT将她的意大利语翻译成英语,并转述给现场的其他人。GPT非常迅速地处理完了信息,并翻译道:“Mark,她(米拉·穆拉蒂)想知道鲸鱼会不会说话,它们会告诉我们什么?”

除了此前注意到Mark的紧张情绪,在后续的演示中,Zoph将面部对准手机的摄像头,识图要求ChatGPT描述他的样貌。经过两次尝试,GPT给出了不完美但确实很不错的答案。GPT注意到了Zoph脸上的微笑,对他说:“看起来你沉浸在快乐当中,笑逐颜开。”

当然,基于此次更新的视频处理能力,还有很多很酷的能力,比如直接通过摄像头拍摄录制或者截图来向GPT实时提问,甚至陪你一起逗弄你的小狗。

新的桌面应用也给出了精准度上来之后的展望,比如更科幻的AI自动操控你PC屏幕与桌面,并根据你的指令完成任务。人类与AI、人类与人类、AI与AI相互交流共存,理解这个世界。未来已来。

发布会后,5月14日,多模态概念集体异动。成为今年又一个AI应用端值得持续跟踪的方向。此前,相关概念股曾反复活跃,但也套牢了一波追高者,除了AI硬件,Sora,Kimi等概念也饱受追捧,龙头信雅达和华策影视分别取得了9天7板,三连20cm的成绩。

值得注意的是,在去年,AIGC概念也一度被热炒,中科信息和万兴科技等AI应用端概念股都在去年上半年取得了超过3倍的成绩。但是随着全球AI应用发展低于预期,AGI进展逐渐悲观,不少概念股都仅剩下去年涨幅的一半。更受认可的往往是英伟达为首的硬件“卖铲人”,直到今年以来OpenAI进展迅速,才逐渐唤回投资者的信心。不过,盲目追概念的投资者至今仍然被套牢,站在“高高的山岗上”等待解套。

【声明】如转载内容涉及版权等问题,请立即与我们联系,我们将迅速采取适当措施。

0 阅读:1

海凡资本

简介:感谢大家的关注