中国工业大模型行业发展研究报告

报告融于业 2024-10-12 22:56:40

工业大模型丨研究报告

核心摘要:

工业大模型伴随着大模型技术的发展,逐渐渗透至工业,处于萌芽阶段。就大模型的本质而言,是由一系列参数化的数学函数组成的计算系统,且是一个概率模型,其工作机制是基于概率和统计推动进行的,而非真正的理解和逻辑推理,因此,当前大模型具有不可解释性和幻觉不可消除等主要特征。就大模型落地工业的情况而言,工业互联网、等工作已经让部分工业企业遍历了数据采集-数据存储-数据处理-数据分析-数据资产沉淀-数据应用的过程,部分场景已经准备好了向基础大模型投喂的“数据原料”,当经过简单数据处理、微调、适配后,可以解决部分垂直细分场景问题,具有落地可行性。就工业大模型的发展进度而言,工业大模型与工业互联网一样,都是要挖掘数据资产的价值,而数据准备的阶段性工作在工业互联网时期大部分已经准备好,故我们预计工业大模型的进程在技术不受限的前提下,可能会快于工业互联网。当然,工业大模型是以大模型技术为驱动,其进程快慢很大程度受限于大模型本身能力的进化。

工业大模型玩家与工业互联网平台玩家重合度高,其成长路径目前也表现出高度相似的特征,但目前市场产品、服务、落地场景都处于探索阶段,大家都在同一起跑线。就参与玩家而言,大模型技术底蕴、行业know how、运维资源等方面是各类玩家主要锚定的优势,且都是基于自身优势点,围绕具体应用场景摸索大模型在工业的落地性进行市场切入的。就具体产品形态而言,整体还较为稚嫩,目前大模型的能力更多还是依附于已有产品体系,鲜少有独立的产品出现,未来随着大模型流量入口特性明朗,有望独立成产品。就应用场景而言,当前大模型的不可解释性和幻觉等特性,与工业“0容错”的特性相悖,因此当前大模型落地工业的探索更多聚焦于偏运营的、具有一定容错能力的场景(如知识问答、辅助设计/代码生成等),而生产制造等核心场景的探索需要静待模型进化以及CV大模型、多模态大模型的发展。就发展挑战而言,模型、数据、应用、商业变现是无法避开的话题,且各方相互影响,互利共赢。

大模型落地工业的探索中,还处于非常早期的阶段,供需双方都在尝试,当然,也有很多问题值得探讨与思考。1)大模型落地工业的竞争要素:基础能力、模型能力、模型应用是主要竞争点,且在不同行业发展阶段,其相对竞争优势有所不同,具体而言:短期主要看大模型技术,长期则主要看模型应用深度。2)大小模型间的关系:大小模型间不存在替代关系,是并存且是协同融合赋能的关系。3)工业大模型服务走向平台化:大模型落地工业的服务平台化特征以开始显现,且逐步形成垂直行业大模型+智能体+小模型+机理模型为主的平台化调用方案。4)产业数据拉通助力工业大模型能力进化的同时,对大模型落地工业的广度、深度都大有裨益。

当我们在说AI时,在说什么?

AI本质就是一系列参数化的函数所组成的计算系统,并在一定的框架环境下,进行数据计算和参数调优的过程

整体来看,AI通用技术框架主要分为基础层、技术层、应用层三层,不同公司,在整体框架上都保持一致,只不过针对基础层和技术层的部分内容划分,略有区别,但主旨就是为各类函数组成的计算系统提供环境、数据、算力等支撑,最终达到模型运行并输出结果的目的。具体到不同层级的主要玩家而言:1)基础层和技术层的AI框架和算法/架构上,其玩家比较类似,主要是国内外领先的科技巨头、云厂等参与,如谷歌、Meta、微软、亚马逊、阿里、百度、华为等;2)应用层和技术层的工具组件、通用技术,其玩家更加百花齐放,针对行业、场景、功能等各角度发力,推动AI工具和应用的落地。当前,大部分大模型玩家的侧重点更多聚焦于通用技术的提升、应用的领域的拓展。

大模型是什么?大模型的能力如何获取?

大模型是从海量数据中学习并记住泛知识后,在域内数据+提示数据集的修正下,具备在某类具有相对更准确能力的计算系统,其本质是概率模型

据Andrej Karpathy所言,大模型本质由巨大的参数文件+运行参数的代码文件两大核心组件构成。其中:1)参数文件是通过大量数据训练获得的,代表从数据中提取的有用信息和模式(可称为“知识”),其参数量与对知识的记忆能力,与数据量、数据按照不同说明进行曝光的次数有关。2)代码文件有点类似“大脑”,主要是指导参数文件进行推理和产出,其中,可根据域内数据、提示数据集等进行调参,不断提升模型的准确性。因此,总结来看,大模型能力获得主要有四步:1)针对大量数据进行预训练,让大模型学习并记住知识;2)明确大模型能力侧重点,即给一定高质量、针对性强的域内数据集微调,让大模型在某些能力更加突出;3)通过标注人员对大模型给出的答案进行排序,给予大模型正向反馈;4)强化学习。以上,也说明大模型的能力不是只要参数量足够大就具备涌现能力,是需要逐项优化才逐步具备某些能力的。需要注意的是,大模型本质是一个概率模型,可从2个角度理解:1)具有不可解释性:虽然可以调参,但是并不知道这些参数在做什么,如何协同工作,表示的是什么意思;2)幻觉不可消除:模型的工作机制是基于概率和统计推断进行的,而非真正的理解和逻辑推理,且与预训练的数据量、曝光次数、微调数据量及数据的选择、奖励函数偏好等息息相关。

大模型在工业应用是否具有可行性?

数据积累、数据资产沉淀等基础以具备,大模型落地工业领域成为可能

大模型的本质是由一系列参数化的数学函数组成的计算系统,是人工智能系统对知识的一种表示和处理方式,本身就具备“数据喂养—认知构建”的“学习”能力。因此,在已经学习海量通用数据、具备一定泛化能力的基础模型的基础上,向其“喂养”特定行业/场景的数据及规则,经过定制开发、调整、训练、调优等操作后,该基础模型将获得特定行业/场景能力的“认知能力”,在一定程度上可称为特定行业/场景大模型。

就工业领域而言,工业互联网、工业智能制造等工作,已经让部分工业领域企业遍历了数据采集-数据存储-数据处理-数据分析-数据资产沉淀-数据应用的过程,部分场景已经准备好了向基础大模型投喂的“数据原料”,当经过数据处理、适配、微调,甚至是训练后,逐步演进为工业大模型,可以解决部分垂直细分场景问题,大模型落地工业成为可能。

工业大模型主要玩家有谁?如何切入市场?

厂商类型多样,覆盖软硬件厂商,基因不同所形成的优势各有侧重,但切入市场的角度类似,在市场竞争打法、客户选择、市场策略等方面趋同

根据基因不同可将工业大模型厂商分为8类:1)互联网大厂、ICT企业、AI厂商,强调AI原生能力和基础大模型能力;2)传统软件厂商凸显客户服务经验、运营资源优势;3)制造大厂、机器人厂商彰显行业know how、行业数据、设备应用等优势;4)安全厂商侧重在企业全局运维中的安全保障。综合来看,虽然各家优势有异,但切入市场的策略相似,即:锚定自身优势点,围绕具体应用场景摸索大模型在工业的落地性,且目标都是有钱、技术底蕴、有意愿的头部客户。当前,对比国内外企业的市场切入思路,主要差异有二:1)在合作方上,国外企业具有资源顶端优势,强调从算力底层出发,构建算力-推理的能力地图,而国内企业则强调底层大模型的能力与丰富性;2)在服务思路上,国外企业相对更强调将数据链路服务体系做深,而国内企业更强调各功能模块间的组合。

工业大模型的产业价值流转情况如何?

上游服务方整体集中,且头部效应明显;中游市场参与玩家众,虽服务能力各有侧重,但结合行业know how/行业数据积累进行基础大模型微调、RAG是主要服务思路;下游市场需求广阔,但尚处于探索阶段

工业大模型玩家将如何挣钱?

定制化的综合解决方案是当前核心收费模式,更多收费模式可能需探索

大模型落地于工业领域尚处于萌芽期,其产品形态、服务内容都还在逐步摸索中,其变现方式虽有一些相近服务或行业可以参考,整体不确定性非常高,但一切尝试也都有意义。

工业大模型供给方常规的做法是:与基础大模型厂商合作-测试大模型特点、性能-结合自身产品/能力进行微调-根据客户需求进行客制化服务。因此,目前相对比较确定的变现方式是类似于“保姆式”的针对某个场景/具体功能的综合解决方案服务收费。除了定制化的解决方案收费外,部门供给方也开始尝试通过软硬件一体产品进行补充收费。

虽然一些基础大模型的厂商API调用是目前较为普遍的变现方式,但深入到工业大模型服务领域,API调用、智能体调用及分发抽佣等方式的变现还处于积累阶段,目前市场还需要验证。

值得注意的是,大模型的能力具有很强的进化性,2024年9月OpenAI推出的最新的o1版本,表现出比较强的复杂推理能力,这又是扔工智能新水平的一个重要进展。因此大模型未来的能力极限在哪里,我们尚未可知,大模型能为工业领域带来哪些类型的赋能和服务,同样也未知。正是这份未知,未来工业大模型的变现将存在诸多可能。

工业大模型玩家的成长路径为何?

目前尚处于产品雏形期,探讨成长路径为时过早,但很大可能会借鉴工业互联网平台产品-项目-平台的成长路径

工业大模型市场还处于非常初期的阶段,大模型能力更新迭代快,还有非常多尚未可知的潜力,故工业+大模型的应用可能也有无限想象空间。工业大模型的成长路径可借鉴与参考工业互联网平台的,主要原因有2点:1)二者在客户定位、服务内容、服务目标等各方面的重合度比较高;2)当前阶段,工业大模型表现出来的能力,更像是在工业互联网平台的基础上,对数据信息价值的挖掘进一步深入和易用化,服务思路是一致的。但大模型的成长路径也具有极强的不确定性,因为:1)大模型能力具有进化性;2)工业大模型市场仍处于产品雏形期,很多能力仍然停留在产品设想与理论实验阶段,尚未进入真正的工业实践。因此目前急需解决的是产品-项目的积累与闭环链路构建,打牢基础后,项目-平台及生态才有机会逐步验证。

大模型落地工业的产品服务架构是怎样的?

模型及服务是大模型落地工业的核心,也是大部分工业大模型厂商对外赋能的基础

大模型落地工业领域的服务框架依然分为基础底座-模型及服务-模型应用三层。其中,模型及服务是核心,主要提供两大类型的服务:1)提供预训练模型,可供其他企业通过调用/部署,提供基础的大模型能力;2)提供预训练模型后服务,如辅助微调、提示工程、训练、压缩、优化等,可供模型能力进一步适配与适用。当前,工业大模型市场的模型应用都是在大模型的基础能力+模型的适配与适用的基础上进行定制衍生的。

大模型落地工业的产品落地模式有哪些?

大模型落地工业时主要以软件为主,但具体产品形态还在摸索中

目前大模型落地工业时的产品切入角度主要有5大类:基础底座、工具、软件服务、硬件产品、硬件赋能。1)基础底座与工具主要由一些基础模型厂商提供,具有较强的头部效应,未来随着大模型能力的提升,有助于赋能软件开发、测试等全流程,以及硬件端的具身智能。2)针对具体应用时,以一些工业互联网平台厂商推出为主,但各方尚在探索大模型与自身产品及服务的结合点,产品形态还较为稚嫩,多以基于通用大模型进行微调、RAG验证后形成自己的大模型,然后依附于已经存在的产品(如工业APP)上,单独形成具体应用产品的并不多。未来,随着大模型能力稳定性、准确性提升,大模型有望成为新的流量入口,独立成一个新的产品的也并非不可能。

大模型落地工业的应用场景有哪些?

偏运营的、有一定容错能力的场景是当前重点,生产制造等核心场景的探索需要静待模型进化以及CV大模型、多模态大模型的发展

目前大模型落地工业主要表现为3大特征:1)大模型无法保证输出的准确性,故当前有容错能力的场景是各家探索重点;2)大模型的应用无法脱离行业know how的加持,基本是都是通过微调或者RAG技术进行调整,故掌握着丰富工业数据、工业机理模型的企业在工业领域将更有优势;3)目前还是以分析和预测为主,决策还是非常初级的辅助决策,未来控制和应用决策能力的发展需要充分发挥时序数据(如设备、产线运转数据、监控数据等)、IT和OT数据相结合后的价值,故大模型能力进化与其他类型大模型的成熟变的非常迫切。

大模型落地的主要挑战有哪些?

模型本身有缺陷、数据准备不足、应用不够深入等是当前遇到的主要挑战,且各方相互影响

大模型落地工业的挑战主要聚焦于模型、数据、应用、商业变现几方面。针对模型:其根本是模型本身的问题,即存在幻觉、不可解释性、成本高等问题。针对数据:更多是数据共享性、数据质量等问题。针对落地应用:则关乎决策成本和应用深度等问题。针对商业化:则与前面三大挑战息息相关,即模型与数据相互促进,模型进步将推动应用落地,应用的推进能带来更好的商业化变现。

思考1-大模型落地工业的竞争要素有哪些?

基础能力、模型能力、模型应用是主要竞争点:短期看,具有模型技术优势的企业占优,长期看,则是模型应用更深的企业有望后来居上

大模型落地工业,本质上还是以能解决客户需求为导向。从需求方角度看,客户主要关心两点:结果准确性+服务于业务。因此,对于供给方而言,模型技术与业务理解缺一不可,只不过具有不同基因的企业,在基础能力、模型能力、模型应用这三方面所具备的优势不同,但这三方面是大模型落地的主要竞争要素,且不同发展阶段其相对优势也有所不同。具体而言:从短期来看,工业大模型行业是大模型技术发展带来的,以模型技术推动行业发展为主,此时,具有技术优势的企业将占领先机;从长远来看,技术本身是为行业服务的,故具有行业know how积累的企业反而能推动行业走的更远,其相对优势将会更加明显。

思考2-工业需要的是大模型还是小模型?

工业大模型与工业专用小模型并存,且是协同融合赋能工业应用的关系

在进行工业应用时,大小模型各有所长,其能力都不可忽视,当前也不存在谁替代谁的情况。大模型落地工业应用时,主要依托于强大的生成能力和针对复杂信息的捕捉与构建能力,因此在知识问答、文本/图片生成等以创造见长的场景应用比较多。而小模型则凭借高性价比、预测结果相对准确等优势,在工业质检、设备维护等场景高度成熟。

整体来看,大小模型融合赋能工业应用是必然。原因主要有二:其一,大模型除了能有效促进小模型推理能力、鲁棒性性能提升外,还能通过调用的形式充分利用小模型,进一步发挥小模型应用的敏捷性;其二,通过小模型归纳总结业务/场景的运转原理后,可帮助供给方预判针对项目设计的大模型行动方案的可行性,进而降低项目时间和金钱成本。

思考3-工业大模型的服务将会走向平台化?

大模型落地工业的服务平台化特征以开始显现,且逐步形成垂直行业大模型+智能体+小模型+机理模型为主的平台化调用方案

大模型虽然在一定程度上具有泛化能力,但具体到应用时,需要进行微调等操作,其具有很强的定制属性,如何减少重复性工作,甚至减少定制化是各供给方共同探讨的命题。而行业大模型+智能体+小模型+机理模型为主的平台化调用方案似乎成为大部分企业的共同选择。但有两点需要注意:1)平台化强调知识沉淀、工具等调用的便捷性,而不拘泥于存储形式/路径;2)大模型工业应用时,其演进具有一定阶段性,基本遵从场景-垂直细分行业-工业领域的路径。

0 阅读:0

报告融于业

简介:感谢大家的关注