OpenAI 的新 GPT-4 人工智能模型已经亮相,并且已经支持从视障虚拟志愿者到 Duolingo 改进的语言学习机器人的所有内容。但是,GPT-4 与ChatGPT和 GPT-3.5等早期版本有什么不同呢?以下是这些流行系统之间的 5 个最大区别。
首先,名字里有什么?尽管 ChatGPT 最初被描述为 GPT-3.5(因此在 GPT-3 之后进行了几次迭代),但它本身并不是大型OpenAI 语言模型的一个版本,而是一个基于聊天的界面,可以连接到它所基于的任何模型。ChatGPT 在过去几个月里人气飙升,它是一种与 GPT-3.5 交互的方式,现在它是一种与 GPT-4 交互的方式。
话虽如此,让我们看看您熟悉和喜爱的聊天机器人与其新增强的继任者之间的区别。
1. GPT-4 可以看到和理解图像这个多功能机器学习系统最显着的变化是它是“多模态”的,这意味着它可以理解不止一种“模态”的信息。ChatGPT 和 GPT-3 仅限于文本:它们可以读写,但仅此而已(尽管对于许多应用程序来说已经足够了)。
但是,GPT-4 可以接收图像并对其进行处理以查找相关信息。当然,你可以让他描述一下图片中的内容,但重要的是,他的理解不止于此。OpenAI 提供的示例实际上用一张大得可笑的 iPhone 连接器的图片来解释这个笑话,但与 Be My Eyes 的合作伙伴关系更能说明问题,Be My Eyes 是一款供盲人和视障人士使用的应用程序,可以让志愿者描述他们的手机看到的内容。.
在 Be My Eyes 的视频中,GPT-4 描述了裙子上的图案,识别植物,解释如何到达健身房的某台机器,翻译标签(并建议食谱),阅读地图,并执行一些其他任务,显示他真正得到了什么。图像中显示的是什么 - 如果他被问到正确的问题。他知道这件衣服是什么样子,但他可能不知道它是否适合你的面试。
2. GPT-4 更难作弊尽管今天的聊天机器人做的所有事情都是正确的,但它们往往很容易误入歧途。一点说服力可能会让他们相信他们只是在解释“糟糕的人工智能”会做什么,或者其他一些让模型说出各种奇怪和彻头彻尾令人不安的事情的小捏造。人们甚至在“越狱”技巧上进行合作,这些技巧可以快速从他们的笔中释放 ChatGPT 和其他人。
另一方面,GPT-4 已经根据用户在过去一两年中善意给予 OpenAI 的大量恶意提示进行了训练。考虑到这一点,新模型在“真实性、处理和拒绝越界”方面比其前辈要好得多。
正如 OpenAI 所描述的那样,GPT-3.5(运行 ChatGPT)是新学习架构的“试运行”,他们将吸取的教训应用到“前所未有的稳定”的新版本中。他们还能够更好地预测其功能,从而减少意外的数量。
3. GPT-4内存大这些大型语言模型是在数以百万计的网页、书籍和其他文本数据上进行训练的,但是当它们真正与用户对话时,可以说它们能“记忆”多少是有限的(一个同情) . GPT-3.5 和旧版 ChatGPT 的这个限制是 4096 个“令牌”,大约 8000 个单词或大约 4-5 页书页。因此,在他的注意力功能“倒退”了这么远之后,他似乎失去了对事物的追踪。
GPT-4 的最大令牌数为 32,768 - 如果您想知道为什么这个数字看起来很眼熟,那就是 2^15。这相当于大约 64,000 个单词或 50 页的文字,足以完成一出戏剧或一个故事。
这意味着在谈话中或创作文本时,他最多能记住 50 页左右。因此,他会记住你在 20 页聊天前谈论的内容,或者可能会提到 35 页前写故事或文章时发生的事件。这是对注意力机制和令牌计数器如何工作的非常粗略的描述,但总体思路是关于扩展内存及其相关功能。
4. GPT-4 更加多语言AI 世界由母语为英语的人主宰,从数据到测试再到研究论文的所有内容都是用该语言编写的。但是,当然,大型语言模型的可能性适用于任何书面语言,并且应该对它们可用。
GPT-4 更进一步证明它可以用 26 种语言(从意大利语到乌克兰语再到韩语)高精度地回答数千个多项选择题。它最适合罗曼语和日耳曼语,但也适用于其他语言。
这种对语言能力的初步测试很有希望,但远未完全覆盖多语言能力;考试标准原来是英文翻译的,选择题也不是真的普通话。但他擅长一些他没有受过专门训练的东西,这表明 GPT-4 对非英语人士来说可能更友好。
5. GPT-4 具有不同的个性“可控性”是一个有趣的人工智能概念,指的是它们按需改变行为的能力。这可能很有用,例如,当您扮演富有同情心的倾听者的角色时,或者很危险,例如,当人们说服模特她生气或沮丧时。
GPT-4 比 GPT-3.5 更自然地集成了处理,用户将能够将“具有固定细节、语气和风格的经典 ChatGPT 个性”更改为更适合他们需要的东西。“在限制范围内,”团队很快指出,并指出这是让模型打破角色的最简单方法。
这可以通过向聊天机器人发送消息来完成,例如“想象你是桌面角色扮演游戏中的 DM”或“像你是接受有线电视新闻采访的人一样回应”。但实际上您只是在建议“默认”GPT-3.5 身份。开发人员现在可以从一开始就融入观点、对话风格、语气或交互方法。
GPT-4 与其前身之间存在更多差异,大多比这些更微妙或更技术性。毫无疑问,随着时间的推移和用户试用最新的语言模型,我们会学到更多。
想亲自测试 GPT-4?它将出现在付费的 OpenAI ChatGPT Plus 服务中,很快就会通过开发者 API 提供,并且很可能很快就会提供免费演示。