经过乔恩·惠特尔《对话》
(奥努东格尔/盖蒂图片社)
我是一名计算机科学家,也是一个糟糕的圣诞购物者。周末,我想知道人工智能系统是否能够帮助我。
我能否提示 ChatGPT 为我的表弟 Johnny 挑选一份个性化礼物,并及时将其运送到他手中?唉,快乐的聊天机器人无能为力,告诉我它“无法直接购买或处理运输”。
自 ChatGPT 推出以来的两年里,我们看到一波又一波的人工智能产品和功能有望将我们从平凡的任务中解救出来。然而到目前为止,除了购物网站或应用程序上奇怪的内置聊天机器人之外,礼品购物还超出了他们的能力。
然而,到明年圣诞节,情况可能会有所不同。许多专家预计 2025 年的一件事是人工智能代理的崛起:可以在现实世界中代表您采取行动的机器人。
代理已经来了人工智能代理可以做的不仅仅是建议你在哪里可以获得圣诞老人服装。它可以为您购买并送货上门。
“代理人工智能”的愿景是人工智能代理团队将协同工作。您会给您的代理团队一个提示:
今年我正在做圣诞晚餐。找到我最亲密的 Facebook 好友,向他们发送邀请,确保其中一位是厨师,并告诉他们带火鸡来。
特工们会帮您解决所有问题,您无需费力。至关重要的是,人工智能代理应该具有跨多个网站进行协调的能力。
事实上,有限的人工智能代理已经存在。人工智能开发商 Langchain 的一份报告称,51% 的受访者已经在生产中使用人工智能代理。
2024 年,风险基金在人工智能代理项目上投资了约 18 亿美元。德勤最新的全球预测报告认为,25% 使用生成式人工智能的公司将在 2025 年推出代理式人工智能项目。
研究公司 Gartner预测,到 2028 年,15% 的日常工作决策将由人工智能代理做出。
给大家做代理吗?我们还看到消费者代理商开始出现。这些系统可能会自动执行许多基于浏览器的任务(包括购物)。
10 月,Anthropic(流行的 Claude 生成人工智能机器人背后的公司)发布了一项“计算机使用”功能,允许人工智能接管用户的鼠标和键盘来浏览任何网站并执行操作。
教育专家 Leon Furze 创建了一个演示,使用计算机自动浏览学习管理系统,打开作业页面,创建作业文本,然后单击提交按钮。所有操作均通过单个文本提示自动完成。
最近,Google Deepmind 发布了自己的版本Project Mariner,它同样允许人工智能在 Chrome 浏览器中自主导航并执行操作。
这两个系统仍然是早期版本,Project Mariner 仅适用于一组值得信赖的测试人员。但它们暗示了即将发生的事情。
如今,您无法使用这些工具中的任何一个来自动化圣诞购物 - 至少不容易。那么,要打造一个真正有用的圣诞购物人工智能代理,需要什么?
技术是存在的购物代理的技术方面相对简单。作为用户,我可能想给出一个提示,例如
给我在英国的家人寄照片礼物。从手机中选择一些有趣的家庭照片,搜索提供照片礼物的网站,为每个家庭成员订购合适的礼物,然后使用我的地址簿发送。
执行此操作需要多个人工智能代理:一个负责查找照片,一个负责查找购物网站,一个负责个性化礼物,一个信用卡代理负责购买礼物,还有一个地址查找代理。
无论是通过计算机使用、Project Mariner 还是其他一些人工智能代理平台,今天没有任何技术原因无法做到这一点。
信任问题然而,让人工智能代理发挥作用还存在两个重大障碍。
首先,也是最明显的,是信任。您会信任人工智能代理提供您的信用卡详细信息吗?
尽管自 ChatGPT 以来人工智能已经取得了两年的进步,但幻觉(人工智能不知道答案,因此只是编造一些东西)仍然是一个问题。
最近的一项研究表明,即使在人工智能编程(人工智能最流行和最有价值的用途之一)中,人工智能生成的编码问题答案中也有 52% 包含错误。
AI 只需犯一个错误,就能将莫莉阿姨的礼物发送给乔叔叔。我们只希望这是一个无害的错误,例如礼物搭配不当,而不是泄露您的银行帐户详细信息。
代理商需要了解什么第二个不太明显的障碍是,人工智能代理要发挥作用,就需要了解上下文。即使是购买礼物等相对简单的事情,背景也至关重要。
我对母亲的喜好有多年的了解。我并不总是能做出正确的反应,但我会比一般的人工智能响应做得更好。这些知识通常是默认的,ChatGPT 根本无法访问丰富的人类互动历史,从而获得完美的礼物。
话虽如此,人工智能机器人已经在记录有关其用户的信息。为了证明这一点,只需问 ChatGPT:“你对我了解多少?”根据您的设置,您可能会对答案感到惊讶。
也许在某个时候,我们经常使用的人工智能系统会对我们和我们的家人有足够的了解,以至于圣诞购物可以完全自动化。
但今年,我还是得自己来处理。呸骗人!
乔恩·惠特尔 (Jon Whittle),Data61总监
本文根据知识共享许可从The Conversation重新发布。阅读原文。