提升地理空间分析效率,火山引擎ByteHouse上线GIS能力

惊蛰研究所 2024-03-19 12:25:45

在数字化时代,地理空间分析(Geospatial Analytics)成为辅助企业市场策略洞察的重要手段。无论是广告投放的精准定位,还是电商物流的效率优化,都离不开对地理空间数据的查询、分析和可视化处理,以便助力企业更好决策。

一些传统的地理信息系统数据库具备丰富的地理空间对象结构、成熟的空间索引能力,在导航、旅游、智能城市等典型应用场景中被广泛使用。随着实时分析报表等OLAP市场的扩大,地理空间分析也作为新的增值特性被业界几大OLAP主流产品所推广。OLAP+GIS能力在满足用户地理空间数据分析的基础上,还能在数据体量大、实效性要求高的情况下,满足业务高性能查询的需求。

作为火山引擎推出的一款OLAP引擎,ByteHouse近期发布了高性能地理空间分析GIS能力,为位置洞察、人群圈选等场景提供高性能地理数据分析服务。

在功能层面,ByteHouse兼容OGC标准,支持导入标准GIS文件格式,目前已支持超过50个主流的空间函数。为了提供更极致的使用体验,ByteHouse还在探索自研优化器适配GIS特性,以及GPU硬件层面优化二维空间函数。

更值得一提的是,在关键性能上,ByteHouse GIS在列式小批组织的数据结构上引入RTree等二维空间索引能力,并在CPU硬件层面实现了二维空间函数的性能优化,整体提升了端到端性能。

在Benchmark测试中,通过选取两个关键 GIS 函数ST_DistanceSphere 和 ST_Within,使用 NYC Taxi 数据集(Size:21GB;条数:169,001,162),并选取3个不同大小的地理区域,研发人员将ByteHouse、StarRocks、 ClickHouse Community、PostGIS 、 DuckDB Spatial进行性能对比。测试结果显示,ByteHouse 在优化器、硬件等层面的优化,使其在测试函数的性能上显著超越其他产品。

据火山引擎ByteHouse技术专家介绍,“对比传统地理信息系统数据库,ByteHouse将OLAP和GIS结合起来,一方面具备OLAP的高效查询和计算的优势,另一方面,空间数据对象按照列的方式存储,不仅节省存储空间,更能充分发挥向量化的优势,特别是在空间函数层面,还能利用硬件并行化能力提速。”

目前,ByteHouse GIS 已经在POI洞察、作战地图、人群圈选、拓店选址等场景为相关需求方落地地理空间分析服务。以有配送需求的业务场景举例,在ByteHouse GIS能力支持下,运营人员可以在地图中圈选出特定多边形,观察多边形内部商家的供给和客流量,显示配送员的位置和配送状态,实现更有效地调度资源,提高配送效率。

在电商场景中,ByteHouse GIS能力不仅满足平台商家运营快速分析商家经营状态、管理商家的需求,还将数据读取量减少超过50%,进一步降低了磁盘IO以及计算带来的CPU开销。

不仅仅在GIS能力上具备极致性能,ByteHouse基于分布式架构设计,可以轻松地水平扩展,处理PB级别的数据,还完全兼容云原生技术栈,支持弹性资源调度,能够根据实际需求动态调整计算资源,并且具备自动化运维功能。未来,ByteHouse也会持续为用户提供卓越的数据处理和分析体验,助力企业实现数字化转型和智能化升级。

0 阅读:0

惊蛰研究所

简介:探索发现新经济。