随着 ChatGPT 等 AI 智能应用在全球范围内的风靡,大语言模型技术(Large Language Model,简称 LLM)受到各行业企业和个人用户的广泛关注。图数据库凭借图形格式组织和连接信息的方式,能够帮助大语言模型更好地理解实体间的关系,提升自己的表达和推理能力。那么,大语言模型与图技术在具体应用领域又能碰撞出怎样的火花呢?
经过悦数研发团队的努力和与国际多家知名大语言模型 LLM 技术团队的合作,目前悦数图数据库的产品已经可以实现基于 Graph + LLM 技术的 Text2Cypher,即自然语言生成图查询。用户只需要在对话界面中通过自然语言就可以轻松实现知识图谱的构建和查询,更有开箱即用的企业级服务,欢迎大家在文末点击试玩体验新一代的悦数图数据库 x 知识图谱应用吧!
大语言模型如何让图谱应用更智能?作为图技术领域最常见应用之一,知识图谱以点-边形式的图结构组织和表示知识,不仅可以用于表示实体(如人、地点、事件、概念等)之间的关系,还包含这些信息之间的语义含义,以一种结构化的方式生动描述现实世界中的知识,使得计算机能够理解和推理这些知识,被广泛应用于风险控制、生产制造、药物研发、科研探索等领域。
顾名思义,Text2Cypher 做的就是把自然语言的文本转换成 Cypher 查询语句。一直以来,阻碍图数据库、知识图谱被更广泛应用的因素之一就是查询图数据库的技术门槛。那么,在没有大语言模型的时候,我们是怎么做的呢?
传统的 Text2Cypher文本到查询的这个领域在大语言模型之前就一直存在这样的需求,一直是知识图谱最常见的应用之一,比如 KBQA(基于知识库的问答系统)的系统内部本质上就是 text2cypher。
当一个问题语句发送过来之后,它首先要做意图识别(Intent)、实体识别(Entity),然后再利用 NLP 模型或者代码把相应的意图和实体构造成知识图谱的查询语句,最终查询图数据库,并根据返回结构构造答案。
可以想象,让程序能够:
从自然语言中理解意图:对应到哪一类支持回答的问题
找出实体:问题中涉及到的主要个体
从意图和实体构造查询语句
不可能是一个容易的开发工作,一个真正能够落地的实现要训练的模型或者实现的规则代码所考虑的边界条件可能非常多。
大语言模型实现的 Text2Cypher而在”后大语言模型“时代,这种从前需要专门训练或者写规则的”智能“应用场景成了通用模型+提示工程(Prompt Engineering)就能完成的任务。
注:提示工程指通过自然语言描述,让生成模型、语言模型完成”智能“任务的方法。
为此,悦数图数据库经历了一系列研发验证工作,最终实现了大语言模型与图查询语言表达的对接。用户在提出任务的时候,只需要使用自然语言,就可以实现 Schema 获取、Cypher 语句生成的 Prompt、各种大语言模型(LLM) 的调用、结果的处理,真正实现了无需代码、开箱即用的知识图谱构建和查询方案。
使用悦数图数据库:轻松搭建下一代知识图谱应用通过悦数图技术与大语言模型的结合,企业用户可以轻松实现知识图谱的构建和查询。不仅可以以较低的费用成本完成高准确性的查找和直观的可视化呈现,而且不再需要长时间的学习投入才能掌握从图中获取重要洞察的方法了。
和上一代知识图谱相比,悦数图数据库和大模型的结合,能够让企业以更低成本更便捷地构建基于海量数据的知识图谱。同时,用户能直接使用自然语言进行交互式提问和查询,降低企业使用门槛,用户学习成本更低。
Demo 体验您可以点击 Demo 链接,一起来体验使用自然语言实现知识图谱构建&查询的乐趣。也欢迎通过官网或公众号关注我们,和悦数图数据库一起链接数智未来新时代!