GraphRAG宣言:为生成式AI添加知识

架构即是人生 2024-07-15 08:16:43

原文:https://neo4j.com/blog/graphrag-manifesto/

我们正进入 RAG 的"蓝色链接"时代

我们即将意识到,要想用生成式 AI (Generative AI) 做任何有意义的事情,你不能仅仅依赖自回归大语言模型 (autoregressive LLMs) 来做决策。我知道你在想什么:"RAG 就是答案。"或者是微调 (fine-tuning),或者是 GPT-5。

没错。像基于向量的 RAG 和微调这样的技术确实能提供帮助。对某些用例来说,它们已经足够好了。但是还有另一类用例,这些技术都会遇到瓶颈。基于向量的 RAG - 就像微调一样 - 增加了许多类型问题得到正确答案的概率。然而,这两种技术都不能保证得到正确答案。它们通常也缺乏上下文、细节,以及与你所知道的事实的联系。此外,这些工具并没有给你太多线索来解释它们为什么做出特定的决定。

早在 2012 年,Google 在一篇具有标志性的博文中介绍了他们的第二代搜索引擎,标题是"介绍知识图谱:事物,而非字符串1"。他们发现,如果你使用知识图谱 (knowledge graph) 来组织所有这些网页中的字符串所代表的"事物",同时也进行所有的字符串处理,就有可能实现能力的巨大飞跃。我们现在看到生成式 AI 中正在上演同样的模式。许多生成式 AI 项目正在遇到瓶颈,其中结果的质量受到限制,因为使用中的解决方案只处理"字符串,而非事物"。

快进到今天,AI 工程师和处于前沿的学术研究人员正在发现与 Google 当年一样的事情:突破这个瓶颈的秘诀是知识图谱。换句话说,在基于统计的文本技术中引入对"事物"的知识。这就像任何其他类型的 RAG 一样工作,只是除了向量索引之外还调用了知识图谱。或者换句话说,就是 GraphRAG!

本文旨在全面而易读地介绍 GraphRAG。事实证明,构建数据的知识图谱并在 RAG 中使用它可以带来几个强大的优势。有大量研究证明,对于大多数(如果不是全部)你可能问大语言模型的问题,它都能给出更好的答案,而不仅仅是使用基于向量的 RAG。

仅这一点就将成为 GraphRAG 被广泛采用的巨大驱动力。除此之外,由于数据在构建应用程序时是可见的,所以开发更容易。第三个主要优势是图可以被人类和机器同样理解和推理。因此,使用 GraphRAG 构建更容易,能给出更好的结果,而且 - 这在许多行业中是杀手级特性 - 可解释和可审核! 我相信 GraphRAG 将取代仅基于向量的 RAG,成为大多数用例的默认 RAG 架构。本文将解释原因。

等等,图?

让我们明确一点,当我们说图时,我们指的是类似这样的东西:

虽然这张图片被广泛用于示例知识图谱,但其原始来源和作者仍未确定。已知最早使用出现在 Farahnaz Akrami 的这篇 Medium 文章中。如果您是这张图片的创作者,请与我们联系,以便我们提供适当的署名。

或者这样:

William Lyon 的权力的游戏可视化

或者这样:

伦敦地铁图 (版权:伦敦交通局)。有趣的是,伦敦交通局最近部署了一个基于图的数字孪生,以改善事故响应和减少拥堵。

换句话说,不是图表。

如果你想深入了解图和知识图谱,我建议你去看看 Neo4j 的 GraphAcademy 或 Andrew Ng 的 Deeplearning.ai 课程 Knowledge Graphs for RAG。我们在这里不会过多探讨定义,而是假设你对图有基本的工作知识继续前进。

如果你理解上面的图片,你就可以看到如何在 RAG 流程中查询底层的知识图谱数据 (存储在图数据库中)。这就是 GraphRAG 的内容。

两种知识表示:向量和图

典型 RAG 的核心 - 向量搜索 - 接收一段文本,并从候选文本体中返回概念上相似的文本。这种自动化的过程令人愉快,对基本搜索非常有用。

你可能没有每次都想到向量是什么样的,或者相似性计算是在做什么。让我们从人类角度、向量角度和图角度来看一个苹果:

人类的表示是复杂的、多维的,我们无法在纸上完全捕捉到。让我们允许一些诗意的许可,想象这张诱人的美丽图片代表了苹果在所有感知和概念上的荣耀。

苹果的向量表示2是一个数字数组 - 一个统计领域的构造。向量的魔力在于,它们每个都以编码形式捕捉了相应文本的本质。然而,在 RAG 环境中,它们只在你需要确定一堆词与另一堆词的相似程度时有价值。做到这一点就像运行一个相似性计算 (也就是向量数学) 并得到一个匹配。然而,如果你想理解向量内部的内容,理解它周围的内容,掌握文本中表示的事物,或者理解这些如何适应更大的背景,那么向量作为一种表示方式就无法做到这一点。

相比之下,知识图谱是世界的声明性 - 或者用 AI 术语来说,符号性 - 表示。因此,人类和机器都可以理解和推理知识图谱。这是一个很大的优势,我们稍后会再讨论。此外,你可以查询、可视化、注释、修复和扩展知识图谱。知识图谱代表了你的世界模型3 - 代表你正在处理的领域的那部分世界。

GraphRAG "vs." RAG

这不是一场竞争.

向量和图查询在 RAG 中各自增加价值。正如 LlamaIndex 创始人 Jerry Liu 指出的那样,将 GraphRAG 视为包含向量是有帮助的。这与"仅向量 RAG"不同,后者严格基于文本中单词的嵌入相似性。

从根本上说,GraphRAG 就是 RAG,其中检索路径包括一个知识图谱。如你在下面所看到的,GraphRAG 的核心模式很简单。它基本上与基于向量的 RAG 架构相同4,但在图中添加了一个知识图谱层。

GraphRAG 模式

在这里,你可以看到触发了一个图查询。它可以选择包含一个向量相似性组件。你可以选择将图和向量分别存储在两个不同的数据库中,或者使用像 Neo4j 这样同时支持向量搜索的图数据库。

使用 GraphRAG 的一个常见模式如下:

进行向量或关键词搜索,找到初始节点集。遍历图以获取相关节点的信息。可选地,使用基于图的排名算法 (如 PageRank) 重新排列文档。

模式因用例而异,就像今天 AI 中的其他一切一样,GraphRAG 正在成为一个丰富的领域,每周都有新的发现出现。我们将在未来的博文中专门介绍目前看到的最常见的 GraphRAG 模式。

GraphRAG 生命周期

使用 GraphRAG 的生成式 AI 应用程序遵循与任何 RAG 应用程序相同的模式,只是在开始时增加了一个"创建图"步骤:

创建图类似于将文档分块并将其加载到向量数据库中。工具的进步使得图的创建变得非常容易。好消息有三个方面:

图高度迭代 - 你可以从"最小可行图"开始,然后从那里扩展。一旦你的数据进入知识图谱,就很容易进行演变。你可以添加更多类型的数据,以获得数据网络效应的好处。你还可以提高数据质量,以提高应用程序结果的价值。这部分技术栈正在快速改进,这意味着随着工具变得越来越复杂,图的创建只会变得更加容易。

将图创建步骤添加到之前的图中,你会得到一个如下所示的流程:

我稍后会深入讨论图的创建。现在,让我们把这个放在一边,谈谈 GraphRAG 的好处。

为什么选择 GraphRAG?

我们看到的 GraphRAG 相对于仅基于向量的 RAG 的好处主要分为三类:

更高的准确性和更完整的答案 (运行时/生产好处)一旦创建了知识图谱,就更容易构建5和后续维护你的 RAG 应用程序 (开发时间好处)更好的可解释性、可追溯性6和访问控制 (治理好处)

让我们深入了解这些:

1: 更高的准确性和更有用的答案

我们看到的 GraphRAG 的第一个 (也是最直接的) 好处是更高质量的响应。除了我们从客户那里看到越来越多的例子外,越来越多的学术研究也支持这一点。其中一个例子来自数据目录公司 Data.world。在 2023 年底,他们发布了一项研究,显示GraphRAG 平均将大语言模型回答的准确性提高了 3 倍,涉及 43 个商业问题。该基准测试发现,当有知识图谱支持时,回答的准确性显著提高。

最近且可能更为人所知的是微软从 2024 年 2 月开始发布的一系列文章,包括一篇名为 GraphRAG: 解锁 LLM 对叙述性私有数据的发现 的研究博客,以及相关的研究论文和软件发布。他们观察到基准 RAG (即使用向量的方法)存在以下两个问题:

基准 RAG 难以连接各个点。当回答一个问题需要通过共享属性来遍历不同的信息片段以提供新的综合见解时,就会出现这种情况。当被要求全面理解大量数据集合甚至单个大型文档中的概括性语义概念时,基准 RAG 表现不佳。

Microsoft 发现,"通过使用 LLM 生成的知识图谱,GraphRAG 极大地改进了 RAG 的'检索'部分,用更相关的内容填充上下文窗口,从而产生更好的答案并捕获证据来源。" 他们还发现 GraphRAG 比其他方法需要少 26% 到 97% 的 token,这使得它不仅能提供更好的答案,而且更经济、更具可扩展性[7]。

深入探讨准确性这个话题,重要的不仅是答案是否正确,还有答案有多有用。人们发现使用 GraphRAG 不仅使答案更准确,而且更丰富、更完整、更有用。LinkedIn 最近发表的一篇描述 GraphRAG 对其客户服务应用影响的论文为此提供了一个很好的例子。GraphRAG 改善了回答客户服务问题的正确性和丰富性(因此也更有用),将其客户服务团队的中位数每问题解决时间缩短了 28.6%[8]。

类似的例子来自 Neo4j 与我们在 GCP、AWS 和 Microsoft 的合作伙伴一起教授的 GenAI 研讨会。下面的示例查询针对一系列 SEC 文件,很好地说明了使用向量 + GraphRAG 与仅使用向量 RAG 时可能得到的答案类型:

注意描述可能受锂短缺影响的公司特征与列出可能受影响的具体公司之间的区别。如果你是一个投资者,想要在市场变化时重新平衡你的投资组合,或者是一家公司想要在面对自然灾害时重新平衡供应链,能够获得后者而不仅仅是前者可能会带来革命性的变化。在这里,两个答案都是准确的。第二个答案显然更有用。

Jesus Barrasa 的 Going Meta 系列的第 23 集提供了另一个很好的例子,使用法律文档用例,从词汇图开始。

活跃在 X 社交平台和 LinkedIn 上的人会经常看到来自实验室和实际应用的新例子。这里,Lettria 的 Charles Borderie 给出了一个例子,对比了仅使用向量的 RAG 和 GraphRAG,使用了一个基于 LLM 的文本到图的管道,该管道将 10,000 篇金融文章摄取到知识图谱中:

如你所见,不仅 GraphRAG 相比普通 RAG 显著提高了答案质量,而且答案使用的 token 数量减少了三分之一。

我要包括的最后一个值得注意的例子来自 Writer。他们最近宣布发布了一份基于 RobustQA 框架的 RAG 基准测试报告,将他们基于 GraphRAG 的方法[9] 与竞争对手的最佳工具进行了比较。GraphRAG 的得分为 86%,这是一个显著的改进,而竞争对手的得分在 33% 到 76% 之间,且延迟相当或更好。

每周我都会与来自多个行业的客户会面,他们在各种生成式 AI 应用中都经历了类似的积极效果。知识图谱正在为生成式 AI 扫清障碍,使结果更准确、更有用。

2: 改进数据理解,更快迭代

知识图谱在概念上和视觉上都很直观。能够探索它们常常会揭示新的洞见。许多用户报告的一个意外的附带好处是,一旦他们投资创建了知识图谱,他们发现它以意想不到的方式帮助他们构建和调试生成式 AI 应用。这部分是因为将数据视为图形可以描绘出应用背后数据的生动图景。图还为追溯答案到数据,以及沿着因果链追溯数据提供了挂钩。

让我们看一个使用上面的锂暴露问题的例子。如果你将向量可视化,你会得到类似这样的东西,只是有更多的行和列:

当你以图的形式处理数据时,你可以以向量表示无法实现的方式理解它。

这是来自 LlamaIndex 最近的一个网络研讨会[10] 的一个例子,展示了他们提取向量化块的图(词汇图)和 LLM 提取的实体(领域图)的能力,并用"MENTIONS"关系将两者联系起来:

(你可以在 Langchain、Haystack、SpringAI 和更多地方找到类似的例子。)

看着这个图,你可能开始明白为什么在数据所在的地方拥有丰富的结构会为开发和调试开辟广泛的新可能性。单个数据片段保留了它们的价值,而结构本身存储和传达了额外的意义,你可以利用这些来为你的应用添加更多智能。

不仅仅是可视化。还有将数据结构化以传达和存储意义的效果。这是一位来自知名金融科技公司的开发人员在将知识图谱引入他们的 RAG 工作流程一周后的反应:

这位开发人员的反应很好地符合了测试驱动开发的假设,即验证 - 而不是信任 - 答案是否正确。就我个人而言,完全将自主权交给 SkyNet 来做出完全不透明的决定会让我感到不安!更具体地说,即使是不担心 AI 末日的人也能理解能够看到一个块或文档被错误地映射到 "Apple, Inc." 而不是 "Apple Corps" 的价值。由于数据最终是驱动生成式 AI 决策的因素,拥有评估和确保正确性的工具几乎是至关重要的。

3: 治理:可解释性、安全性等

生成式 AI 决策的影响[11] 越大,你就越需要能够说服最终要对错误决策负责的人信任这个决策。这通常涉及能够审计每个决策。它还需要有可靠和可重复的良好决策记录。但这还不够。当有人质疑决策时,你还需要能够向他们解释背后的推理。

单凭 LLM 无法很好地做到这一点。是的,你可以获得用于做出决策的文档的引用。但这些并不能解释决策本身 - 更不用说 LLM 是出了名的会编造这些引用!知识图谱在完全不同的层面上运作,使生成式 AI 管道内的推理逻辑更加清晰,输入更容易解释。

让我们继续使用上面的一个例子,Charles 从 Lettria 将从 10,000 篇金融文章中提取的实体加载到知识图谱中,并将其与 LLM 一起用于进行 GraphRAG。我们看到这提供了更好的答案。让我们看看数据:

将数据视为图是第一部分。数据还可以导航和查询,并可以随着时间的推移进行更正和更新。治理的优势在于,它使查看和审计数据的"世界模型"变得更加容易。使用图使得最终对决策负责的人更有可能理解它,相对于被提供相同数据的向量版本而言。在质量保证方面,将数据放在知识图谱中使得挑出数据中的错误和意外(无论是愉快的还是不愉快的)变得更加容易,并可以追溯到它们的来源。你还可以在图中捕获来源和置信度信息,并在计算和解释中使用这些信息。当你只看同样数据的向量版本时,这是不可能的,这对于普通 - 甚至是高于平均水平的 - 人来说是相当难以理解的。

知识图谱还可以显著增强安全性和隐私性。这在构建原型时往往不是首要考虑的,但它是通向生产环境的关键部分。如果你在银行或医疗保健等受监管的行业中,任何给定员工对信息的访问权限可能取决于该人的角色。LLM 和向量数据库都没有很好的方法来限制信息范围以匹配角色。你可以在知识图谱内部轻松处理这个问题,任何给定参与者访问数据的能力都由数据库管理,并排除他们不允许看到的结果。以下是一个可以在具有细粒度访问控制的知识图谱中实现的简单安全策略示例:

知识图谱创建

人们经常问我构建知识图谱需要什么。理解答案的第一步是了解与生成式 AI 应用最相关的两种图:

领域图 (Domain graph) 是与你的应用相关的世界模型的图形表示。这里有一个简单的例子:词法图 (Lexical graph)[12] 是文档结构的图。最基本的词法图为每个文本块都有一个节点:

人们经常将其扩展到包括块之间的关系和文档对象 (如表格)、章节、部分、页码、文档名称/ID、集合、来源等。你也可以像这样组合领域图和词法图:

创建词法图很容易,主要是简单的解析和分块策略[13]。至于领域图,根据你带入的数据是来自结构化源、非结构化文本,还是两者兼而有之,有几种不同的路径。幸运的是,用于从非结构化数据源创建知识图谱的工具正在迅速改进。例如,新的 Neo4j Knowledge Graph Builder 可以接收 PDF 文档、网页、YouTube 剪辑或维基百科文章,并自动从中创建知识图谱。它就像点击几个按钮一样简单,让你可以可视化 (当然也可以查询) 输入文本的领域图和词法图。它既强大又有趣,大大降低了创建知识图谱的门槛。

有关客户、产品、地理位置等的数据可能已经以结构化形式存在于你的企业中的某个地方,可以直接从它所在的地方获取。以最常见的情况为例,如果它在关系数据库中,你可以使用标准工具[14]来遵循经过验证的关系到图的映射规则。

使用知识图谱

一旦你有了知识图谱,就有越来越多的框架可以用于进行 GraphRAG,包括 LlamaIndex Property Graph Index、Langchain 的 Neo4j 集成以及 Haystack 的等。这个领域发展很快,但我们现在已经到了程序化方法变得简单的地步。

在图构建方面也是如此,有像 Neo4j Importer 这样的工具,它有一个图形用户界面用于将表格数据映射和导入到图中,还有上面提到的 Neo4j 新的 v1 LLM Knowledge Graph Builder。下图总结了构建知识图谱的步骤。

你会发现自己使用知识图谱做的另一件事是将人类语言问题映射到图数据库查询。Neo4j 的一个新的开源工具 NeoConverse 旨在帮助对图进行自然语言查询。这是朝着泛化这一目标[15]迈出的第一个坚实步伐。

虽然图确实需要一些工作和学习才能开始使用,但好消息是随着工具的改进,它正变得越来越容易。

结论: GraphRAG 是 RAG 的下一个自然步骤

LLM 和基于向量的 RAG 固有的基于单词的计算和语言技能提供了良好的结果。要获得持续优秀的结果,需要超越字符串,除了捕捉 "单词模型" 外,还要捕捉 "世界模型"。就像 Google 发现要掌握搜索,他们需要超越单纯的文本分析,映射出字符串下面的事物一样,我们开始在 AI 世界中看到同样的模式出现。这种模式就是 GraphRAG。

进步发生在 S 曲线上:当一种技术达到顶峰时,另一种技术会刺激进步并超越前者。随着生成式 AI 的进步,对于那些答案质量至关重要的用途;或者需要对内部、外部或监管利益相关者解释的用途;或者需要对数据访问进行细粒度控制以保护隐私和安全的用途,那么很有可能你的下一个生成式 AI 应用将使用知识图谱。

你可以亲身体验 GraphRAG!

如果你准备好迈出 GraphRAG 的下一步,我邀请你试试 Neo4j LLM Knowledge Graph Builder。这个简单的网络应用让你只需点击几下就可以从 PDF、网页和 YouTube 视频等非结构化文本源创建知识图谱。它是亲身体验 GraphRAG 威力的完美游乐场。

使用 LLM Knowledge Graph Builder,你可以:

连接到你的免费基于云的 Neo4j 实例,并从你喜欢的文本源构建图。通过交互式可视化探索你新创建的知识图谱。与你的数据聊天并测试 GraphRAG。将你的知识图谱集成到应用中并解锁新的洞察。

要开始使用,请启动一个免费的 AuraDB 实例并构建你的知识图谱。你可以在这里了解更多关于 Neo4j LLM Knowledge Graph Builder 的信息并获得指导性的教程!

致谢

许多人为这篇文章做出了贡献。我要感谢所有分享你们的学习、写作和代码的人 - 这里引用了许多例子 - 并鼓励你们继续这样做。正是通过作为一个社区分享,我们才能共同学习。

我还要感谢许多看到 GraphRAG 重要性并慷慨地抽出时间审阅和评论这篇文章的人。在许多情况下,这是由他们所处的世界中出现的例子所启发的。

与其试图列出每个人的名字,我想特别提出一些你通常不会认为是"图世界"的人。我们一起看到 GraphRAG 不仅是一个重要趋势,而且是两个世界的融合。

说了这么多,我最诚挚地感谢你们所有人,包括 (按姓氏字母顺序):

Harrison Chase, Langchain 的 CEOAli Ghodsi, Databricks 的 CEORod Johnson, 投资者和 SpringSource 的创始人Douwe Kiela, ContextualAI 的 CEO 和 RAG 的共同发明人Christina Li, FPV VenturesJerry Liu, LlamaIndex 的 CEOOwen Robertson, DTS 的负责人Milos Rusic, deepset / Haystack 的 CEO补充: 进一步阅读

关于这个主题已经有大量的文章,每天都有新的见解和例子出现。虽然我无法提供一个详尽的列表,但以下是一些特别好的资料,如果你有兴趣深入了解,可以查看:

DeepLearning.AI 的 知识图谱用于检索增强生成 (RAG) 的短期课程 是一个很好的 60 分钟入门方式。GraphRAG 生态系统工具。首先花几分钟使用 LLM 知识图谱构建器 创建一个基于 YouTube 视频、你喜欢的 PDF 或维基百科页面的数据和概念的知识图谱。如果你还没有 Aura Free 实例,可以在这里创建一个用于知识图谱构建器。加入 GraphRAG Discord。Tomaz Bratanic 的文章 使用 Neo4j 和 LangChain 实现"从局部到全局"的 GraphRAG:构建图谱,该文将 Microsoft 的 GraphRAG 工作整合到 Neo4j + Langchain 管道中。Tomaz Bratanic 的其他博客文章。说真的,它们都很棒。Ben Lorica 的两篇文章:绘制通向更智能 AI 的图谱路线图 和 GraphRAG:设计模式、挑战、建议。一些音频参考:The Data Exchange 播客集,用图谱增强 AI (2024 年 6 月 27 日),Ben 和我都在其中讨论了这篇文章的内容,以及更多。2024 年 7 月 4 日 ThursdAI 播客一周年特别集,其中包括一个由 Emil Eifrem 主导的专门讨论 GraphRAG 的环节。德勤的论文 使用知识增强的生成式 AI 进行负责任的企业决策,副标题为"为什么企业级生成式 AI 必须整合知识图谱?"Jesus Barrasa 的 Going Meta 系列。目前已有 27 个视频,每个视频都涵盖了 GraphRAG 的不同方面或示例。Leann Chen 的学习视频,包括 你需要更好的知识图谱来实现 RAG 和 使用 Neo4j 知识图谱构建高级 RAG 聊天机器人。LlamaIndex 的六部分闪电 属性图谱入门。GraphStuff.fm 播客,由 Jennifer Reif、Andreas Kollegger、Alison Cossette 和 Jason Koo 主持。最后但同样重要的是,如果你需要向老板证明 GraphRAG 的价值,并想增加一些分量,不妨看看 Gartner 2024 年生成式 AI 影响雷达,它将知识图谱置于当前最相关的生成式 AI 技术靶心位置!

1 阅读这篇博客文章,了解 Google 在网络搜索方面的历程如何成为生成式 AI (Generative AI) 当前发展的绝佳类比。

2 注意:这些特定数字可能代表也可能不代表一个苹果。很难确定,这正说明了向量和图谱之间的一个关键区别。

3 正如后面"知识图谱创建"部分所讨论的,除了"领域图谱"之外,另一种知识图谱正在出现并证明其有用性。这就是"词汇图谱",它不是世界模型,而是向量块及其相互之间以及与周围文档结构(表格、图像、页面、文档、集合、作者等)关系的图谱。

4 自然,在现实世界中,这通常不仅仅表现为一个全面的步骤,而是越来越多地成为遵循自身一系列步骤和逻辑的智能体 (AI Agent) 管道的一部分。顺便说一下,这也是一个图谱。随着这些变得越来越复杂,人们可能会考虑将这些工作流程和规则捕捉到图数据库中,而不是代码中。但我们还没有达到那个程度,这也是另一个话题。

5 这在你已经有一个知识图谱的情况下才会启动。这并不是免费的,但有了最新的进展,你可能会惊讶于这变得多么容易实现。由于这是一个基础性的话题,我们在下一节专门讨论了构建知识图谱的科学和艺术。

6 知识图谱还可以帮助其他形式的可追溯性,例如捕捉数据在系统之间的流动,通过系统间 / 溯源 / 数据谱系图谱。它们还可以提供其他 AI 优势,例如跟踪已解析的实体。由于这里的重点是 GraphRAG,我们将把这些暂且搁置。

7 如果你想更深入地了解这一点并接触一些可运行的代码,我强烈推荐我的同事 Tomaz Bratanic 的文章:使用 Neo4j 和 LangChain 实现"从局部到全局"的 GraphRAG:构建图谱。这篇文章进一步推进了 Microsoft 的工作,将其整合到 Neo4j + Langchain 管道中。

8 论文本身包含了 GraphRAG 和仅基于向量的 RAG 方法的更详细比较,发现 GraphRAG 在 MRR 上改善了 77.6%,在 BLEU 上改善了 0.32,相较于基线。

9 恰好由 Neo4j 提供支持。

10 这是一个很棒的网络研讨会,展示了他们新的 (大约 2024 年 5 月) 属性图谱索引的使用,其中包括将文本转换为图谱的内置方法。

11 我想我们都知道"影响"的含义,但为了细分:这包括任何错误答案可能会产生健康与人类安全影响、社会与公平影响、声誉影响或高额金钱影响的决策。显然,这也包括任何可能受到政府监管或其他合规影响的决策。

12 请注意,这里的"词汇"一词不仅指单个词,而是更广泛地(如下面的字典定义所示)"与词语或语言词汇相关的"。这包括一切存在于一个词语体系及其关系领域内的内容。

13 一些做这件事的库包括(无特定顺序):Docs2KG、Diffbot、GLiNER、spaCy、NuMind、NetOwl® 和(特别是在实体解析方面的强项)Senzing。

14 敬请期待 2024 年下半年推出的这个工具的新版本,它将支持直接连接到你选择的关系数据库。

15 NeoConverse 和 LLM GraphBuilder 都是 Neo4j 构建的不断增长的 GraphRAG 生态系统工具 的一部分。

0 阅读:4

架构即是人生

简介:感谢大家的关注