ChatBI新高度:这款Agent,破除「数据幻觉+深度洞察」两大难关

数智前线 2025-04-07 16:00:06

Manus之后,又一款Agent公测在即,将终结传统的ChatBI数据幻觉,支持企业数据分析一问到底,其背后的技术突破是什么?

文|魏德龄

近年来的每一个春节,都成为人工智能的闪耀时刻。随着DeepSeek V3/ R1模型的发布,让本地部署成为了新的热潮,以至于配合RAG(检索增强生成),每个人都能在本地终端构建自己的知识库。

但在实际测试使用中便会发现,想要让 AI 给出符合预期的回答,并不是把自己的文件往库里一甩那么简单,尤其是对于专业知识的理解学习与逻辑推理,AI并非像人们想象中那样顺理成章。

对于早就已经迈向数智化转型的众多企业来说,这一问题更是由来已久。以银行业为例,日常说“三大行”一词,通常指工农中建交这样的头部银行,但在某银行的工作对话中,却是指北京、上海、深圳的分行。再看连锁快餐行业,某品牌内部系统用 “GC” 代表 “订单数”,但大模型在面对数据表时,可能根本无法理解何为“GC”。

Aloudata大应科技创始人&CEO周卫林

“经营决策场景下,企业知识语义表达的载体就是‘指标’,其管理平台就是‘指标平台’。也因此,指标平台是企业最为确定性的私域知识库。”Aloudata大应科技创始人&CEO周卫林在不久前举行的NoETL指标平台最佳实践研讨会上表示。

随着AI技术的不断增强,人才、技术与资本将不再是企业的真正壁垒,而“知本”作为企业的独有认知体系和知识库,一旦形成竞争优势,将难以被复制和超越。这也是为何市场正在对ChatBI给予强烈关注的原因所在。

然而,如同文章开篇提到的实际知识库应用落地难题,在很多企业的多年数据积累的过程中,本应成为竞争壁垒的数据知识,却甚至成为内部工作中的阻碍。

01

NoETL破除企业数据之痛

报表口径不统一,一直是困扰众多企业内部人员的难题 。平安证券数据平台产品负责人倪程伟指出,同一个指标可能在不同的报表里呈现不一致,或管理模式调整切换口径后,无法更新全部报表,带来潜在数据差异。原因在于指标定义分散在报表中,无法共享。

他表示,信息呈现多但数据洞察少,也是一个经常出现的问题,最终企业内部只是看到了大量的总体数据,但难以理解数据背后的各种维度和变化。也就是说,工具和数据难以深入契合场景,进行多维分析、切片分析、关联分析或归因分析。

还有一点便是重复开发的问题,报表数量众多,但实际业务价值不明确。传统ETL(数据抽取、转换和加载)+数据集的生产模式下,开发工作分散在不同团队和人员手中,报表开发周期长、灵活性差,业务需求已经难以被灵活快速满足。

另一个在日常生活中最常见的表象,可能就是在进行促销活动的快餐厅,本来一场营销活动是想提升客户的满意度或拉升月活黏性。然而,活动期间若餐厅应对猛增的出餐需求不力,导致出餐速度变慢、油炸食品品相欠佳,或者取餐系统信息滞后,那这次营销反而可能走向负面。

这一切表象背后,根源往往在于指标难以在各部门间达成统一。例如:供应链部门关注物料准备,运营部门负责员工调配,管理层则通过移动驾驶舱查看数据。麦当劳中国数据中台负责人陈润红表示,最后由于数据源和计算逻辑不一致,常常在营销活动进行到一半时,发现各部门的数据对不上,导致决策混乱。

面对不同行业在数据管理和消费过程中所出现的集中痛点,Aloudata在三年前提出了NoETL理念。在业务取数、用数体感最强烈的场景,即指标的生产、管理、消费场景,Aloudata打造了业界首个“管研用”一体化的NoETL指标平台,通过定义清晰的明细级指标语义,对接数仓明细层模型进行指标定义,代替中间层和应用层的建模,然后通过自动化构建和物化加速实现指标的定义、开发、管理、消费的一体化,让业务无需掌握ETL技能,无需等待漫长排期,随时可对全域数据开启自助灵活的分析与洞察。

目前,NoETL指标平台已经成为平安证券、麦当劳中国、华润数科、中国南方航空、lululemon、理想汽车等30余家头部企业的选择,该平台周查询API调用量已达亿级,助力企业内部指标统一性与维度定义的标准化,并实现了数据资产的沉淀,提升指标开发管理的降本增效。

“NoETL就是通过将ETL Engineers驱动的数据工程,转变为ETL Agents驱动的数据工程,实现数据处理流程的自动化重构。只有完成这种生产力变革,才能真正满足AI时代的数据分析需求。”周卫林表示,NoETL不仅解决了当下传统BI体系中最根本的供需矛盾,也正在为ChatBI的真正落地扫清障碍。

02

为Chat BI落地扫清障碍

有人说GPT的爆发恰恰是被前缀的Chat所点燃。通过自然语言的交互,让人工智能有机会成为每一个人告别技术门槛的生产力工具。对于企业来说,也自然希望在内部能够构建起ChatBI,BI作为企业数字化进程中最为基础和普遍的应用场景,与AI的结合已经是必然趋势。

而通过上文内容不难发现,ChatBI的关键恰恰在于数据,解决业务日常沟通指标口径与AI获取指标语义保持一致的关键正在于ChatBI与数据仓库之间,必然依赖指标平台实现明细级的语义层中介,从而实现数据的AI-Ready。

Aloudata 联合创始人兼首席产品官肖裕洪

“我们的口号是‘Less cost, more intelligence’,即以更低的人力成本、存算成本和应用接入门槛,实现数据的 AI-Ready,以高度自动化的数据工程体系推动企业智能生态的繁荣发展。”Aloudata 联合创始人兼首席产品官肖裕洪表示,围绕新的企业落地目标,Aloudata进行了一系列产品的关键升级。

为了帮助企业以低成本实现数据高效就绪。Aloudata在今年将专门在语义引擎上进行重大升级。

首先是指标定义的增强,让企业能够以最优雅、最高效的方式定义指标和建模。比如支持多角色关系的建模,支持基于指标值定义和快速变更维度(标签),支持公共(杂项)维度的定义;其次是指标加速的增强,重点优化查询路由改写、物化构建效率与Cube加速功能;最后是指标治理的增强,进一步提高相似指标的识别能力,提供更加精细的审批管理和审计日志,并通过多环境发布和字段级的影响评估,进一步提升数据质量。

Aloudata还将结合AI技术推出智能建模助手,以提升企业在复杂场景下的数据建模效率。

在指标和维度的批量创建场景中,智能助手可以显著提升效率。此外,智能语义助手还可应用于更深度的语义生成和洞察分析中,例如可自动提取常用维度或热门维度,帮助用户在多维归因分析的时候更好地选择合适的分析维度;或者自动从指标构建血缘、查询记录中挖掘出指标关联因子指标,帮助用户在归因时自动关联相关指标,提供更深入的洞察。

智能助手还可以实时监测用户的分析行为,识别性能瓶颈或不经济的查询模式,并提前进行智能加速,确保分析体验的流畅性;以及自动盘点企业中的重复指标或无用指标,为管理者提供清晰的管理视图,提升治理效率。

Aloudata AIR和Aloudata CAN两大平台作为以NoETL理念所打造的产品,将通过深度融合,确保企业的所有数据能够轻松连接和高效利用,并为企业的多智能体生态提供单一可信的数据服务。Aloudata目标未来在存算层、用户体系层、权限层和血缘关系上,实现更深层次的融通。

“在 AI 时代,企业要为各种智能体提供一份单一可信的数据源,而 Aloudata AIR同Aloudata CAN的深度融合,形成了一个路径更短、成本更低、自动化程度更高的 NoETL工程体系,将有力支撑企业的数字化重心从‘数据呈现’转移到‘数据洞察’。”肖裕洪表示,融合的原因在于企业对数据就绪速度的需求显著提高,而数据编织能够借助数据虚拟化技术,达成轻量级数据集成与准备、按需物化的效果。

在实际业务推进过程中,Aloudata AIR逻辑数据编织解决方案,是为ChatBI进行快速、低成本的数据集成准备的理想方案。

随着 AI-Ready 数据底座构建的进一步完善,明细级的指标语义层实现了数据覆盖度的最大化——既包含清晰的指标与维度语义定义,又基于明细数据支持所有指标和维度的灵活组合,还可以支持最细粒度的归因下钻。这也意味着ChatBI最后的落地障碍被扫清,秉持着 “既许人以援手,必扶持到底” 的理念,Aloudata宣布将于4月下旬推出一款以“万数皆可问”为目标的ChatBI智能体——Aloudata Agent。

03

“万数皆可问”的Chat BI智能体

“‘万数皆可问’不仅是一个愿景,更是我们通过技术手段实现的承诺。我们希望通过一个强大的 NoETL数据底座,为上层的Aloudata Agent提供更完整的数据覆盖、更精准的数据语义、更强大的查询性能和更可靠的安全保障。”肖裕洪表示。

Aloudata Agent的目标,是解决ChatBI在数据查询中面临的诸多挑战。例如数据覆盖度不足、口径不一致引发的准确性问题、性能不稳定或不可控的查询响应问题,以及数据越权或泄露的安全问题。Aloudata Agent目前已经具备了一些重要的功能和特性,能够为企业提供初步的智能化支持。

第一是对话式分析。Aloudata Agent支持灵活、准确的对话式取数、归因分析和智能分析报告生成。结合明细级的语义层和查询时灵活衍生的能力,Aloudata Agent不受预定义局限,可以实现任意指标(基础度量)与维度的灵活组合分析;结合NoETL自动化查询加速能力,Aloudata Agent无需数仓预加工宽表,进一步释放问数的灵活性和实时性。未来将会通过迭代升级,达到与专业分析师同级别的归因分析能力,能够提出假设与验证假设。

第二是分析过程透明化。在ChatBI这种容错性较低的场景中,分析过程的透明化至关重要。Aloudata Agent会清晰呈现分析过程,保留中间产物。如此一来,用户可以清楚地知晓每一步的分析逻辑,并且在后续需要时,能够对分析进行回溯和审计。

第三是数据准确可信。Aloudata Agent的数据准确性依赖于 Aloudata CAN指标平台的标准化明细级语义沉淀。它能够将用户的问答与企业标准指标口径对齐,确保分析结果的准确性和可信度。

第四是数据安全可保障。Aloudata通过指标平台所具备的精细化的数据权限管理功能,确保数据在分析过程中的安全性和可控性。

为了配合Aloudata Agent的推出,Aloudata还提供了面向AI的API和SDK,赋能企业快速实现AI应用创新,构建智能体生态。 Aloudata AI API是一套加速企业AI 应用开发的工具集,尤其对 RAG场景进行了深度优化,旨在通过简化数据集成与复杂分析流程,帮助企业更高效地构建智能应用。

在NoETL指标平台最佳实践研讨会上,周卫林专门谈到了针对企业ChatBI落地的三个建议,即“好数据,强智能”、“可溯源,可审计”、“全开放,大生态”。纵观Aloudata依托NoETL理念打造并持续升级的产品,以及最新发布的Aloudata Agent,无疑正在围绕这18个字,为企业构建起AGI时代的数智基建。

“我们坚信,AI 时代的关键是Data,是知识库,是数据语义层,是数据虚拟化,这是我们的判断,也是我们创立这家公司的初心。”周卫林这样介绍了“Aloudata”名称的由来,它源于“AI on data”的理念。

自NoETL理念诞生的三年以来,正在逐步筑牢企业的数据根基,化阻碍为“知本”壁垒。如今,随着Aloudata围绕AI时代进行的一系列升级,以及Aloudata Agent的全新推出,在“好数据”的根基之上,为企业种下了“万数皆可问”的知识之树。

0 阅读:1

数智前线

简介:关注数字化、云计算、智能硬件。