使用代理AI时保持数据隐私和安全

拥抱科技有未来 2025-02-04 10:20:33

在数据隐私和人工智能方面,公司处于选择困境。一方面,企业渴望利用人工智能的技术进步,包括自主人工智能代理(AI Agent)的开发。但另一方面,数据泄露和违反数据法规的潜在风险正在抑制人工智能的热情。可信计算初创公司Opaque的人员表示,他们的新版本加密平台可以提供一种解决方案。

Opaque是近十年前在加州大学伯克利分校计算机科学实验室RISELab出现的一个开源可信计算项目。2021年,RISELab的几位参与者共同创立了Opaque公司,其中包括RISELab董事Ion Stoica和Raluca Ada Popa、Wenting Zheng教授以及RISELab研究生Rishabh Poddar和Chester Leung。

作为一个可信计算项目,Opaque为其框架内处理的数据的安全性和隐私性提供了一定的保证。最初的可信计算工作集中在多方协作与竞争(MC2)平台上,该平台使多个数据所有者能够对集体数据进行联合分析和ML模型训练,而不会相互泄露各自的数据。

如今,Opaque提供了一个可信的计算平台,客户可以在该平台上构建和运行他们的人工智能应用程序,并享有完整的数据隐私和安全保障。使用Opaque平台的客户可以获得内置的数据加密、加密密钥管理、列级和行级访问控制以及防篡改审计跟踪等功能。

GenAI的潜在影响是巨大的。麦肯锡2023年的一项研究得出结论,该技术每年可以为世界经济增加2.6万亿至4.4万亿美元。尽管潜力巨大,但只有一小部分GenAI应用程序真正走出了开发和测试阶段。许多对公司的调查都强调,安全和隐私是GenAI受阻的主要原因。

例如,2024年Dataiku的一项研究发现,77%的受访者认为,围绕GenAI的最大问题是缺乏治理和使用控制。Cloudera的《企业人工智能和现代数据架构状况报告》得出结论,采用人工智能的最大障碍是担心人工智能带来的安全和合规风险(74%)。2024年IBM商业价值研究所的一项研究发现,80%的首席执行官表示,其组织使用下一代技术(如GenAI)的透明度对于培养信任至关重要。

Opaque提供的保证应该有助于公司将其AI应用程序从开发和测试阶段转移到生产阶段。

“Opaque的核心价值主张是,我们正在帮助公司加速将人工智能投入生产。”Opaque平台架构负责人Leung说。“它使数据能够用于机器学习和人工智能,而不会损害数据的隐私和主权。”

Leung说,拥有先进加密技术的公司可能会建立自己的可信计算框架,提供与Opaque相同的隐私和安全保障。然而,拥有这些技能的人通常在公开市场上并不普遍,特别是在构建大型企业使用的大规模分布式应用程序时,这是Opaque的目标市场。

“可信计算需要你了解密码学。它需要你了解系统,以及如何以一种确保系统安全的方式扰乱系统,这将使你能够扩展它们,”Leung在一次采访中说,“所有这些知识对于日常数据科学家来说都不是那么容易获得的……不幸的是,这并不是最容易掌握的东西。”

这家总部位于旧金山的公司的第一个商业产品是GenAI应用程序和第三方大型语言模型(LLM)之间的网关,并防止GenAI提示和检索增强生成(RAG)管道中包含的敏感数据泄漏到LLM。

其最新产品支持新兴的代理人工智能架构,并为跨多个系统的数据和工作流提供安全保障。

“传统上,我们一直专注于批处理分析、批处理机器学习工作。”Leung说,“后来我们支持更通用的人工智能管道,现在我们正在专门为代理应用程序构建。”

Opaque已经筹集了3150万美元的种子资金和A轮融资,目标是那些希望在严格的数据法规和复杂的后台系统中推出人工智能应用程序的财富500强公司。例如,它正在帮助SaaS供应商ServiceNow开发一个帮助台代理,可以在不违反隐私准则的情况下处理敏感数据。

在ServiceNow的案例中,销售代表可能对他们的佣金是如何计算的有疑问。自主人工智能代理面临的挑战是,它必须能够访问和处理各种敏感数据,如年度合同价值和私人财务数据,以便向销售代表解释他们的佣金是如何计算的。

Leung说:“我们提供了这种加密的基因结构,供他们用作员工帮助台代理的后端。”“他们依靠我们来为安全和隐私方面提供动力。”

随着越来越多的公司开始开发代理人工智能系统,他们可能会发现Opaque的新的Compound AI for Agents架构可以方便地解决棘手的安全和隐私问题。根据Opaque的说法,新的代理人工智能架构将确保“代理推理和工具使用的每个方面都保持可验证的隐私和安全性。”

AI本质上是数据的产物。如果没有高质量的数据来训练或微调人工智能模型,构建一个好模型的可能性介于很小和没有之间。尽管世界产生的数据量继续呈上升趋势,但数据科学家发现,他们获得数据的机会更少,而不是更多。Leung希望可信计算能够扭转这一趋势。

他说:“技术进步创造了对数据的巨大需求。”“你拥有的数据越多,特别是你拥有的高质量数据越多,你的人工智能通常就越好。对于传统人工智能来说是这样。对于生成式人工智能来说也是如此。

“现在,我们在过去十年中看到的是……高质量数据的供应实际上已经减少,因为数据是分散的,因为法规、风险团队和法律团队正在限制你如何实际使用这些数据。”

这造成了数据供应和需求之间的紧张关系,这种紧张关系可以通过加密的计算技术和方法来解决。Opaque当然不是唯一一家追逐这一梦想的公司,但考虑到它已经花了十年时间与该国一些顶尖的计算机科学家一起研究这个问题,它应该被视为这个新兴领域的早期领导者之一。

0 阅读:0

拥抱科技有未来

简介:感谢大家的关注