谷歌云为Spanner添加图形处理功能,参与年增长20%图数据库市场

迈步看大势 2024-09-27 19:06:41

Google Cloud更新了其完全托管的分布式SQL数据库服务Spanner,以添加名为Spanner Graph的图形处理功能。此次更新有望帮助开发人员围绕 AI 用例构建应用程序,例如更智能的推荐系统和欺诈检测。

Spanner是谷歌开发的分布式SQL数据库服务,提供全球级的一致性和高可用性。它通过TrueTime API实现精确的时间同步,确保跨数据中心的数据一致性。Spanner支持自动分片和负载均衡,具备水平扩展能力。

增加Spanner Graph的图形处理功能,可以使Google Cloud加入到快速增长的图数据库市场的竞争,这一快速增长得益于其在处理复杂关系数据方面的独特优势,以及AI、大数据、云计算等技术的发展融合。随着这些技术的不断进步和应用场景的拓展,图数据库市场预计将继续保持强劲的增长势头。

Spanner Graph的图形处理与专业图数据库“区隔”

图形处理目前在异常和欺诈检测、推荐器、社交网络分析、图形搜索和各种形式的访问控制中很热门。

为什么是这些特定的应用程序?因为某些数据比其他数据更适合图形处理(将数据元素之间的关系本身视为对象)。此外,不同的图形处理实现提供不同的功能。

进行图形分析的一种方法是使用图形数据库。Neo4j 被认为是典型的图形数据库,它是用 Java 编写的,并提供分析和操作数据库中的功能。但与大多数 NoSQL 数据库不同的是,Neo4j 提供了强大的事务支持。

据 Futurum Group 首席技术顾问 Steven Dickens 称,Spanner Graph将满足AI堆栈中各个行业对高级数据处理和分析解决方案日益增长的需求。

图形数据库对于检索增强生成(RAG)特别有用,因为它们擅长建模和查询数据点之间的复杂关系。这种能力增强了AI应用中相关信息的检索,从而提高了生成输出的准确性和相关性.。

dbInsight 首席分析师 Tony Baer说,对知识图谱和 GraphRAG 模式(可以提供上下文,明确向量嵌入之间的关系)的需求增加是 Spanner 增加图形处理功能的另一个原因。

IDC研究副总裁 Carl Olofson 解释说,Spanner 仍然“本质上是一个关系数据库管理系统 (DBMS)”,并在内部记录数据,包括带有行和列的表格形式的图形数据。新的图形功能使用户能够将图形添加到现有的关系数据库中,并使用图形数学来处理表数据。

这就是为什么 Spanner可能“无法真正挑战”专业图形数据库的原因,例如Neo4j、OrientDB、TigerGraph和Aerospike Graph,这些数据库在性能方面支持纯图形部署。

多模型数据库与专业数据库的“区隔”

Google 向 Spanner 添加图形处理功能的举动与数据库发展的大趋势一致,这些数据库希望被视为提供战略数据库支持,帮助企业整合其数据库需求,添加多模型功能或专业数据库提供的功能。

多模数据库的核心是在一个平台上支持多种数据类型,这样用户可以利用一个平台,处理不同类型的数据,减少了数据处理的复杂性,提高了效率。

一个这样的示例是云数据库提供商包括如 Oracle、AWS、Microsoft、Google、MongoDB等添加的向量功能。以前,向量功能仅由 Pinecone、Weaviate 和 Milvus 等专业数据库提供。

同样,Spanner 的图形处理能力将使谷歌能够与 Neo4j、Amazon Neptune 和 Microsoft Azure Cosmos DB 等图数据库公司和产品竞争。

图数据库已经成为市场增长迅速的数据库领域。根据市场研究公司MarketsandMarkets的报告,全球图数据库市场规模预计将从2019年的6.1亿美元增长到2024年的16.3亿美元,年复合增长率为21.1%。

IDC报告显示,2022年中国图数据库市场规模达到2.4亿元人民币,预计2023年整体市场规模将超过4亿元人民币,呈现快速增长的态势

这些图形功能将使开发人员能够简化数据管理任务,因为现在用户可以使用单一平台来查询结构化和互连数据,从而降低管理多个数据库的复杂性,而且这种效率提升将有助于业务运营。

另外,dbInsight 的首席分析师 Tony Baer 指出,Spanner Graph 填补了 Google 数据库云产品组合中的空白,因为它“直到现在都明显缺失”。

Google 可能首先从 Spanner 开始,因为它希望解决水平可扩展性问题,这长期以来一直是图形数据库的致命弱点。

GQL 和 SQL 之间的互操作性

非常重要的一点是,Spanner Graph 或一般的 Spanner 现在将支持图形查询语言 (GQL),并且数据库还将提供与 SQL 的互操作性。

据分析师称,与 SQL 的互操作性将使 Google 能够利用开发人员和数据专业人员对 SQL 的广泛熟悉和使用,而无需学习新的查询语言。

上个月,谷歌更新了 Spanner,提供了保持双区域配置的选项,这将使企业更容易在云支持更有限的国家/地区遵守数据驻留规范,同时确保可用性。

今年早些时候,该公司表示将在其大多数云数据库(包括 Spanner)中添加向量功能,例如近似最近邻搜索 (ANN) 和精确最近邻搜索 (KNN)等。

ANN 用于优化搜索,换句话说,可以减少大型数据集的延迟,而 KNN 用于在较小的数据集上返回更具体或精确的搜索结果。

谷歌还表示,它将以一种新的方式打包 Spanner,称为 Spanner 版本,其中包括标准版 Standard、企业版Enterprise 和企业附加版 Enterprise Plus 版本的云数据库。

这三个定价不同的版本预计将针对更多企业并提供更大的灵活性。

Bigtable 获得 SQL 支持

在其云数据库的其他更新中,Google 为其 NoSQL 数据库服务 Bigtable 添加了 SQL 支持,其中包括 100 多个 SQL 函数。

Bigtable 增加的 SQL 支持,从用于开发生成式 AI 应用程序的 KNN 和用于日志处理的 JSON 操作,到使用数据草图进行实时分析,现在构建实时、高性能的应用程序比以往任何时候都更容易。

增加的 SQL 支持将有助于满足开发人员和企业不断变化的需求,他们希望使用熟悉的 SQL 查询来利用 Bigtable 的性能和可扩展性。

这个时机反映了来自竞争对手云数据库提供商的竞争压力、对实时分析不断增长的需求,以及对能够处理各种数据类型和工作负载的可扩展数据库解决方案的需求。SQL支持将 Bigtable 定位为市场上更具竞争力的产品,可能会吸引更广泛的用户群并推动云服务的更多使用。

另外,该公司表示,它正在正式推出支持 PySpark、Scala 和 SparkSQL 的新 Spark 连接器,以支持数据科学家在 Bigtable 上构建数据管道和训练大型机器学习模型。

0 阅读:1

迈步看大势

简介:感谢大家的关注