撰稿 | 云昭
出品 | 51CTO技术栈(微信号:blog51cto)
太猛了!甲骨文已经按捺不住,就像找了某种魔法钥匙一般,准备在2024年大干一场!
近日,甲骨文宣布正在将生成式AI功能集成到该公司的整个云服务OCI(Oracle Cloud Infrastructure)的技术堆栈中。
从硬件到基础平台、再到模型和应用,都将全面跟生成式AI深度融合,当然,数据库和Java也在其中。
1、Oracle全生态集成GenAI在过去一年里,甲骨文一直在多种产品中推出其三层生成人工智能战略。该公司于9月发布了OCI Generative AI Service的测试版预览版。
如今,Oracle突然放出了一些列动作,可谓一改保守的姿态,主要有:宣布新模型入驻(Cohere和Meta新模型Llama 2)、新的AI Agents、用于管理开源LLM的新的低代码框架,并使该服务普遍可用。
在一次采访中,Oracle Cloud Infrastructure副总裁兼Generative AI Services总经理Vinod Mamtani,透露了一项甲骨文的计划,其中包括全面提供生成式AI服务、推出生成式 AI Agent以及引入数据科学人工智能快速行动。
IDC集团副总裁Ritu Jyoti表示:“通过在整个Oracle生态系统中集成生成人工智能的通用架构,该公司正在将生成式AI带到云数据中心和内部环境中已有EB级客户数据的地方。”
值得注意的是,这家企业友好型云服务提供商去年在Oracle应用程序套件中的几个应用程序中添加了生成式AI服务,其中包括HCM、SCM、CX、ERP、NetSuite和一系列其他行业垂直模型。
2、宝藏模型Llama 2入驻甲骨文新模型包括Meta的Llama2-70B,这是一种针对聊天用例优化的文本生成模型,以及最新版本的Cohere模型,如Command、Summary和Embed。Oracle在一份声明中表示,这些模型将在可通过API调用使用的托管服务中提供,并补充说,这些模型也可以通过更新的服务进行微调。
此外,除了托管Llama 2,OCI现在还将托管Cohere的520亿嵌入式模型。Mamatani说:“如果你看看排行榜,Cohere的嵌入式模型排名很高。它同时支持英语和多语言嵌入。”他解释说,无论使用何种语言,生成的嵌入都将在同一空间中。
此前,Cohere一直被视为甲骨文的AI大模型宠儿,当时被视为其“构成嵌入Oracle SaaS套件和行业应用程序的GenAI功能的基础”。
最近Llama 2的受欢迎程度飙升,甲骨文当然不会放过这个宝藏模型。有趣的是,这是OCI首次托管Cohere以外的模型。当被问及是什么促使OCI转向Llama 2时,Mamtani说:“关于Llama,我们注意到了它在开发者之间的兴趣和受欢迎程度,这就是为什么我们认为它对我们的客户非常有用。”
OCI Generative AI服务还提供灵活的微调,可通过vanilla和TPU微调用于Cohere的Command 52/6B型号。此外,为了让客户更容易构建他们的人工智能应用程序,Oracle还集成了流行甚广的LangChain。
总的来说,OCI 托管 Llama 2 的决定是一个明智的举措,这有助于他们在竞争激烈的云服务市场中保持领先地位,并吸引更多的客户。
毕竟,托管多个不同类型的模型也可以增加云服务提供商的灵活性和多样性。通过托管这些模型,云服务提供商可以吸引更多的开发者和研究者使用他们的服务,进而推动其云业务的增长。
3、押注AI Agents:RAG、数据库、Java,一个都不能少在测试版中,甲骨文引入的第一个AI代理是RAG代理。Mamtani表示,该代理的工作原理与LangChain类似,它结合了LLM和建立在OCI OpenSearch上的企业搜索的力量,提供了通过企业数据增强的情境化结果。
当企业用户通过业务应用程序向RAG代理输入自然语言查询时,该查询将传递给OCI OpenSearch,这是一种矢量或语义搜索形式。OCI OpenSearch反过来从企业的数据存储库中读取和收集相关信息。然后,ReRanker LLM对搜索结果进行排名,该LLM将排名传递给文本生成LLM,文本生成LLM以自然语言回答查询。
由于LLM是在公共数据集上训练的,并没有囊括这些庞大的企业私有数据。为了解决这一问题,OCI在其OpenSearch中引入了检索增强生成Agents。用户现在可以简单地将自己的文档附加到它上,并开始用自然语言与它聊天。
甲骨文 OpenSearch用例
Mamtani解释道:“它将提供有根据的响应,减少幻觉。我们正在插入对OpenSearch的支持。用户现在可以通过自然语言透明地访问各种企业数据集,而不需要专业技能,也不需要知道数据的格式或存储位置。”
除了RAG Agent,Oracle还计划引入新的Agent。即将发布的版本将支持更广泛的数据搜索和聚合工具,并提供使用AI Vector search访问Oracle数据库23c和使用Vector Store访问MySQL Heatwave的功能。
图片
甲骨文表示,这些AI Agents是在普林斯顿大学和谷歌研究人员发表的ReAct论文的帮助下创建的。Agents通过使用ReAct框架根据一系列想法、行动和观察进行推理、行动和计划。
Mamtani说,这些功能将允许Agents超越信息检索任务,代表用户调用API,并自动化其他任务。Oracle还计划向服务中添加多回合代理,这些代理可以被要求保留过去交互的记忆,以进一步丰富模型上下文及其响应。
至于用途,据该公司称,这些代理及其操作中的大多数都可以添加到其SaaS应用程序套件中,包括Oracle Fusion Cloud applications suite、Oracle NetSuite和Oracle Cerner等行业应用程序。
Oracle还将在其SaaS应用程序套件中提供预构建的代理操作,包括Oracle Fusion Cloud applications suite、Oracle NetSuite和Oracle Health等行业应用程序。Mamtani说:“我们的SaaS应用套件中存在这些复杂的工作流程。因此,我们希望实现自动化和简化。我们会考虑构建专门用于这些应用程序的代理。”
此外,Mamtani表示,Oracle还计划为Java应用程序引入Code Gen Agent。“Oracle收购了Sun Microsystems,所以我们最适合拥有Java语言的Agent,”他补充道。
4、AI Quick Actions低代码部署开源库此外,为了帮助企业使用和管理具有开源库的LLM,Oracle正在其OCI数据科学产品中添加一项新功能,称为AI快速操作(AI Quick Actions)功能。这项功能将于下个月进行测试,它允许对各种开源LLM进行无代码访问。
AI Quick Actions从根本上为部署和微调提供了无代码、低代码的解决方案。为了帮助客户使用开源库(如Hugging Face的Transformers或PyTorch)构建、训练、部署和管理LLM,Oracle还扩展了OCI Data Science的功能。
图片
Mamtani总结道:“我们希望迎合全方位的数据科学家和机器学习从业者。其中,有相当一类开发人员希望尝试并使用其他的开源模型。”
5、后发者的胜算:成本优化相较于AWS、谷歌、IBM而言,甲骨文的动作在去年显得有些缓慢,但正因如此,现在大家看到的激进措施,不得不让人联想到甲骨文是否看到了决胜GenAI赛道的那把破局的钥匙。
有分析人士指出,甲骨文正试图将其生成式AI的基本要素集成到其基本产品中,特别是数据库中,以优化计算资源并降低成本。“许多数据库厂商,例如MongoDB,采用数据库内机器学习功能并在最近在相同数据库中构建、存储和检索向量嵌入(其中被向量化的数据存在),这并不令人意外。这一切都是为了最小化复杂性并最大化支出。”
然而企业很难保证只用同一种数据库,至少需要两个:一个用于向量,一个用于源数据。这将很昂贵,因为他们将不得不为管理两个数据库之间的数据集成和延迟付出代价。
而Oracle的机会或正在于此,该公司已经寻求从数据库处理到芯片网络和数据检索的整个过程中优化其云基础设施。通过降低复杂性并提高性能,能够为其客户和用户提供与众不同的价值。
参考链接:https://analyticsindiamag.com/oracles-generative-ai-madness-begins/
来源: 51CTO技术栈