专访 | 数字经济杂志
数据已成为数字经济时代第五大生产要素,发展数字经济就是要充分发挥数据要素的乘数效应。《数字经济》杂志为此策划了一期深度专访,特邀艾瑞数智首席数据官张晓璐,共同探讨数据乘数效应实现的多元策略。张晓璐分析了发挥数据要素乘数效应的几种途径,并列出艾瑞数智基于这些实现数据乘数效应开发的产品和实践案例,为企业借助数据驱动实现经济价值提供参考。
为什么数据可以成为五大生产要素之一?
从农业时代的煤到工业时代的电,再到信息时代的数据。经济活动越发依赖数据创造价值。数据价值已经不再是附庸品或增值品,而是正发挥着核心价值的新生产要素。
“数据要素”新政出台后,数据与土地、劳动力、资本和技术并列为五大要素市场。随着国家数据局的成立,五大生产力就都可以与政府部门对应上了。
过去,由于数据的隐私安全和数据保护的要求,数据无法被大规模集成成为制约数字要素发展的一大挑战。随着隐私计算、大语言模型等技术的理论突破与工程能力的增强,更多的数据可以合法、合规地汇集到一起,形成数据的网络效应,放大了局部数据的价值。
如何理解数据的乘数效应?
数据作为生产要素具有双重属性。数据的一种属性是劳动对象。数据通过采、存、析、用发挥价值;数据的另一种属性是劳动工具。数据通过融合应用,提高生成效率。因此,数据要素的“乘数效应”可以有两种理解。一种是作为劳动对象,多种数据源的数据汇聚到一起,其价值可以超过单点数据源价值的简单加和,发挥数据的网络效应。另一种是数据作为劳动工具,与场景结合后产生连锁反应。
数据要素发挥乘数效应可以通过三种途径实现。一是数据的内部业务流程打通;二是内部智能决策;三是外部流通赋能。三种途径的价值逐级放大。在第一种途径中,政府或企业会通过信息系统的建设和互联互通实现业务流程的打通,提升效率,这是第一层次的乘数效应。第二层次的乘数效应通过在内部对数据的建模分析,揭示规则与归类,提升生产、经营、服务、管理的决策能力。最高层次的数据价值可以通过打破数据壁垒,赋能外部需求,与多元数据融合,实现数据的普惠。
数据乘数效应都有哪些应用形态与案例?
数据发挥乘数效应的前提需要对数据进行汇聚、整合。然而这并不是一件容易的事情。2014年图灵奖得主迈克尔·斯通布雷克曾说:“为什么数据整合很难,因为必然会遇到要集成多个数据源的情况。但如果不这么做,数据分析就没有意义,机器学习模型就会失效,自然这一切也就丧失了价值意义。”在综合考虑安全合规、隐私保护、风险规避等方面后,目前主要数据要素的应用形态和案例有如下几种。
数据要素的应用形态
1. 数据体内循环
随着大型网络平台,如国外的谷歌、脸书,国内的阿里、腾讯、字节跳动等,业务不断地扩大,平台方积累了大量的数据。这些数据涵盖了用户、商品、内容等多种信息。
数据在平台体内循环,可以最大范围地降低数据泄露风险。这种数据在平台体内的循环一方面可以促进业务的发展,另一方面业务的发展又促进更多数据的产生,形成数据飞轮效应。阿里巴巴通过利用交易数据对消费者或商家进行信用评分,微信用户的行为数据帮助微信广告的精准投放,这都是数据体内循环的典型案例。
2. 外部数据调用
数据的外部流通并创造乘数效应最直接的方式是在数据主体授权的前提下进行外部调用。保险公司调用医疗系统的数据进行核保和理赔,运营商及金融机构调用公安的身份验证服务开通业务,都是在用户授权下外部数据调用的实际应用。这种在授权条件下第三方对外部数据的调用虽然已经被长时间使用,但仍然存在技术无法解决的问题。目前,技术无法保证第三方在使用数据以后是否保存了数据并留作他用。这是目前制约外部数据大规模被调用的关键问题。目前只能通过合同约定的方式保证数据在授权范围内使用,也可以看做是“君子之约”。
3. 数据隐私计算
隐私计算是数据要素外部流通中保护用户隐私的重要技术手段。隐私计算通过多方安全计算、联邦学习等方式,在保护用户数据隐私的前提下,进行所需的加工计算。
常见的隐私计算案例发生在医疗健康场景、金融风险评估场景、智能设备数据隐私保护场景。在医疗健康场景中,在保证无数据离开本地医院的情况下,利用多医院的数据联合分析发现特定患者人群的表型,避免由于人群差异和样本过小对结果产生的影响。在金融风险评估场景中,通过联邦学习计算多头开户投资者的总资产。运营商数据与垂类媒体数据的联合计算,为营销活动提供潜在购买名单,这也是隐私计算的一个实例。
数联网的概念依托隐私计算等技术实现。它可以理解为支持封闭的数据通过隐私计算等底层技术支撑,在保护数据隐私的前提下实现多数据源的互联网络(Internet of Data),以更丰富的维度实现业务应用。然后在实际操作过程中,由于涉及多方数据的使用授权与利益分配等问题,数据隐私计算这一技术方案虽然可行,但实际案例并不多,还处于起步阶段。
4. 统计结果输出
网络平台作为数据的主要承载方,采集了大量数据。网络平台实现数据价值的最易行、最主要的形态是统计分析。统计结果的输出既可以防止个体数据的隐私泄露,又保证了价值的输出。地图软件通过统计驾驶员的信息,判断道路的拥堵程度;运营商通过游客位置的数据的统计分析,判断节假日旅游人流的迁移趋势。电网企业通过统计个人及企业的用电量判断经济运行的趋势等。这些案例都是通过对个体数据的统计分析获得数据价值,为生产生活提供决策的依据。
然而,统计结果能够涵盖的信息相对有限,创造的价值的天花板较低。机器学习可以从历史的数据学到归类,并储存在模型的参数中。神经网络与深度学习技术的发展让模型存储的信息越来越多,突破传统统计信息的瓶颈。
5. 大模型压缩与加密
大模型时代的来临,让数据要素的乘数效应的充分发挥成为可能。大模型对数据起到了压缩和加密的两大作用。压缩可以理解为大模型充分挖掘数据中的规律,用更少的参数表示,减少数据中的冗余,等同于“泛化”的概念。加密可以理解为模型并不是简单对数据的复制,无法通过模型直接还原原始数据的信息。
大模型的智能化应用,如ChatGPT,能够根据输入的文本生成连贯的回答;Stable Diffusion,能够根据输入的描述,生成美妙的图片。数据要素的乘数效应通过智能体的方式得以体现。
艾瑞数智的数据产品与运营实践
艾瑞数智致力于数据要素设施建设、工具开发与运营实践。艾瑞数智围绕数字营销科技的五大场景持续沉淀,不断转化为高效驱动业务发展的数字化运营产品和工具。
艾瑞数智数字营销产品体系图
艾瑞数智针对数据跨域流通与数据交易,提供一套全栈的解决方案。基于这套能力,能够从单体平台到平台联盟构建数据网络,发挥数据的网络效应。
在生产型工具方面,艾瑞数智自研的隐私计算平台为算法工程师和业务开发者提供了平台工具。同时在应用层提供了可以配置的场景化模板,如精准营销、联合风控、数据要素流通的一系列应用模板,并与多家运营商、金融机构、消费企业建立了联邦学习的“样板间”。
在服务运营商营销场景中,智慧大脑通过学习用户历史的行为,实现“客户-产品-渠道”的精准推荐;轻创平台通过分析历史营销素材的投放效果,实现海报创作、H5落地页创作的自动化和千人千面。两者结合起来,可以用较低的成本实现销售转化率36%,覆盖率200%的提升。在服务消费品企业选址场景中,艾瑞数智为全球头部运营品牌分析全国客群及特征数据,为商圈和门店的客群洞察提供决策支持,以更好地评估市场环境并拓展业务。
在服务汽车主机厂“增换购”场景中,算法工程师利用自研的隐私计算引擎实现多渠道数据联合计算销售线索评级;发现高潜客户后,通过检索增强生成(RAG)技术和智能体(Agent)的技术提升自动应答率与交互感知。综合实现领券率提升30% 、到店率提升56%、有效线索占比提升68%、营销人力成本节省20%。
结语
数据要素的乘数效应正在成为推动数字经济发展的新引擎。虽然存在数据壁垒、法律法规等问题,但通过深入挖掘数据的潜力,结合先进的技术和创新的应用,我们可以期待数据将在未来的经济发展中发挥更加重要的作用。艾瑞数智作为行业的先行者,将继续探索和实践,为数字经济的发展贡献力量。