
一、KAG 框架简介
定义与目标
KAG是知识增强生成的专业领域知识服务框架。它旨在充分利用知识图谱和向量检索的优势,并通过四个方面双向增强大型语言模型和知识图谱,以解决 RAG 的痛点:
(1) 对 LLM 友好的知识表示
(2) 知识图谱与原文片段之间的互索引
(3) 逻辑符号引导的混合推理引擎
(4) 基于语义推理的知识对齐
KAG 在多跳问答任务中显著优于 NaiveRAG、HippoRAG 等方法,在 hotpotQA 上的 F1 分数相对提高了 19.6%,在 2wiki 上的 F1 分数相对提高了33.5%。
核心目标:
提升 LLM 在专业领域的事实问答和逻辑推理能力。
通过知识图谱与文本的互索引、混合推理引擎,实现更精准的知识检索与生成。
发布时间与背景
2024年10月25日 正式开源(OpenSPG V0.5版本),后续持续迭代。
技术背景:
基于 OpenSPG 知识图谱引擎,结合 DIKW(数据-信息-知识-智慧)层次结构,升级为 LLMFriSPG(对 LLM 友好的语义增强可编程图)。
二、核心功能与技术架构

1. 核心功能

知识表示与管理LLM 友好的知识表示:
兼容无 schema(无约束)和有 schema(专业领域约束)的知识构建,支持图结构与原始文本块的互索引
噪声降低:通过语义对齐和知识理解减少 OpenIE(开放信息抽取)的噪声问题
互索引结构:结合图结构与文本块,支持高效检索(如 graph-based 倒排索引)
混合推理引擎逻辑符号引导:
将自然语言问题转化为逻辑可执行的查询表达式(Logic Form Query),集成符号推理与 LLM 推理。
运算符类型:
规划(Planning):拆解复杂问题为子任务。
推理(Inference):基于知识图谱的精确匹配或语义推理。
检索(Retrieval):精确匹配、文本检索或数值计算。
多策略集成:
支持 图谱推理、逻辑计算、文本检索、LLM 推理 四种模式的混合求解。
知识对齐与语义增强:
通过语义推理对齐领域知识,提升知识的标准化和连通性,增强一致性。
2. 技术架构

KAG 框架由三部分组成(当前已开源前两部分):
kg-builder(知识构建模块)功能:
构建 LLM 友好的知识图谱,支持:DIKW 层次结构下的知识分层表示(数据→信息→知识→智慧)。
图结构与原始文本块的互索引(如 SPG 升级为 LLMFriSPG)。
兼容无 schema 和有 schema 的知识构建。
kg-solver(推理求解模块)功能:
逻辑符号引导的混合推理引擎,实现:自然语言问题 → 逻辑形式表达式转化。
多跳推理、数值计算、文本检索的混合求解。知识图谱与文本的协同推理(先图谱精确匹配,再文本补充)。
kag-model(模型模块,后续开源):
预计发布 3B 规模的图谱构建与问答模型,提升效率与可扩展性。
三、优势与性能对比

对比传统 RAG 技术,RAG 问题:
向量相似度模糊、逻辑推理能力弱、OpenIE 噪声大。
KAG 解决方案:
通过 逻辑符号引导 和 知识图谱推理,提升多跳问答准确率。
在 hotpotQA 数据集 上 F1 分数提升 19.6%,在 2wiki 数据集 上提升 33.5%。
核心优势精准推理:
支持数值计算、时间关系、专家规则等逻辑约束。
低噪声:通过语义对齐减少 OpenIE 的信息抽取误差。
透明性:推理过程可解释,支持展示中间步骤与知识来源。
四、安装与使用方法

1. 安装方式
GitHub 地址:https://github.com/OpenSPG/KAG
版本:当前为 OpenSPG V0.5,持续迭代中。
2. 使用模式
产品版(面向普通用户)提供可视化界面,支持:本地部署后上传文档、管理知识库。预览抽取结果、知识问答,并展示推理过程。
工具包版(面向开发者)提供 API 接口和编程框架,支持:自定义领域知识图谱构建。集成 GPT、国产大模型(如通义千问)或本地模型。
五、典型应用场景
企业知识库构建
整合内部文档、专家经验,支持高效检索与推理(如金融风控、医疗咨询)。
专业领域问答系统电子政务:
快速解析政策文件,生成合规建议。
医疗健康:
基于医学指南和患者数据,提供精准诊断建议。
客户服务:
复杂问题的多跳推理与个性化解答(如电商平台)。
智能报告生成
金融领域:区域风险报告、投资策略分析(结合知识图谱与动态数据)。
六、KAG 与 RAG 深度对比
纬度一:核心定义与目标
对比维度
RAG(检索增强生成)
KAG(知识增强生成)
定义
结合检索和生成模型,通过检索外部文档(如文本、PDF)的片段,增强语言模型的生成能力。
通过整合结构化知识图谱(KG)与LLM,提升逻辑推理和多跳问答能力,解决RAG的噪声和逻辑不足。
核心目标
动态访问知识库,提升生成的上下文相关性和准确性。
利用知识图谱的逻辑性和结构化优势,解决复杂推理、多跳问题及知识噪声问题。
维度二:技术架构对比
1. 数据处理方式
维度
RAG
KAG
数据类型
非结构化数据(文档、文本、网页等)。
结构化知识图谱(实体、关系、属性) + 非结构化文本(互索引)。
知识表示
依赖向量嵌入(如BERT、Dense Retrieval)进行文本相似度检索。
LLM友好的知识图谱(LLMFriSPG),支持图结构与文本块的互索引,减少噪声。
推理逻辑
依赖模型生成,对逻辑关系(如数值、时间、规则)不敏感。
逻辑符号引导的混合推理引擎,支持多跳推理、数值计算、规则约束。
2. 关键组件
RAG
KAG
检索器:基于向量相似度的文档片段检索(如Dense Retriever)。
生成器:LLM结合检索结果生成答案。
kg-builder:构建知识图谱(结构化+非结构化互索引)。
kg-solver:逻辑符号引导的推理引擎。
kag-model:LLM与知识图谱的协同优化。
3. 核心优势
RAG
KAG
动态知识访问:可实时检索最新或特定领域文档。
轻量灵活:部署简单,适合快速原型开发。
逻辑推理强:多跳问题准确率高(如HotpotQA提升19.6%)。
结构化知识整合:减少OpenIE噪声,提升一致性。
4. 局限性
RAG
KAG
依赖检索质量:若检索到错误或不相关片段,生成结果不可靠。
逻辑推理弱:难以处理复杂关系(如时间、数值)。
知识图谱构建成本高:需专业领域知识,初期构建复杂。
依赖结构化数据:对非结构化数据处理能力弱于RAG。
维度三:应用场景对比
场景类型
RAG适用场景
KAG适用场景
数据类型
非结构化数据为主(如新闻、文档、网页)。
结构化知识(如医疗指南、金融风控规则) + 非结构化文本。
任务类型
简单问答、文档检索、动态信息查询(如实时事件、小众主题)。
复杂推理、多跳问答、逻辑约束问题(如“跨领域因果关系”、“规则验证”)。
典型领域
通用问答、客服系统、企业内部文档检索。
金融风控、医疗诊断、法律咨询、科研分析等需要精准逻辑推理的领域。
维度四:性能对比(基于知识库数据)
指标
RAG
KAG
多跳准确率
中等(依赖检索片段的连贯性)。
更高(HotpotQA F1提升19.6%,2Wiki提升33.5%)。
知识噪声处理
易受OpenIE噪声影响,生成结果可能包含错误。
通过语义对齐和图谱推理降低噪声,提升一致性。
推理复杂度
仅支持简单逻辑,需依赖模型生成能力。
支持符号逻辑、数值计算、规则约束,可拆解复杂问题为子任务。
实时性
可近实时检索动态数据。
动态更新需依赖知识图谱的增量构建,实时性稍弱于RAG。
维度五:技术演进与未来趋势
RAG的改进方向
GraphRAG:通过知识图谱辅助检索,提升多跳推理能力(如蚂蚁集团的早期探索)。
RECIPE:阿里提出的检索增强持续学习,快速植入新知识(轻量化更新)。
KAG的优化方向
降低知识构建成本:通过LLM辅助自动化抽取(如神思电子的“指令微调+图神经网络”)。
混合架构:结合RAG的检索优势与KAG的逻辑推理,形成互补(如KAG支持文本检索补充图谱)。
长期趋势
RAG:作为基础框架,适用于广泛场景,但需依赖外部知识库质量。
KAG:在专业领域(如金融、医疗)逐渐成为主流,尤其在需要精准推理的场景中。
总结:如何选择?
选RAG:需要快速整合非结构化数据(如企业文档库)。任务以简单问答为主,对实时性要求高。资源有限,需轻量级部署。
选KAG:需要处理复杂逻辑、多跳推理或领域专业知识。愿意投入资源构建结构化知识图谱。对答案准确性要求极高(如金融风控、医疗诊断)。