随着人工智能技术的进步,智能化成为产业转型升级的关键抓手,但企业在提升数字化和智能化水平的实践过程中,面临多种挑战,如:移动应用的普及,带来异构数据呈几何级数增长,企业需要深度挖掘数据价值以赋能业务,以及传统 IT 系统缺乏智能化的技术手段,难以有效支撑企业挖掘、组织、管理和运用知识的需要等。
企业急需建立全新的信息和知识处理平台,以智能化的手段推动数据转换为知识,支撑企业创新业务的快速落地和迭代。2021年12月,在以“知识中台驱动产业智能化升级”为主题的2021云智技术论坛-知识智能化专场上,多位百度专家共同探讨企业该如何通过构建全新的知识智能化体系,打造以知识为核心的竞争优势,来重塑未来发展格局。
01 百度智能云知识中台,助力企业加速智能化升级
百度技术委员会主席吴华表示,“智能化是产业转型升级的重要抓手,如今人工智能、大数据、5G 等技术在产业智能化升级中扮演着越来越重要的角色。企业要实现智能化升级,不仅需要数据,更需要数据中蕴含的信息和知识,因此企业知识智能化解决方案变得尤为重要。”产业智能化是数字经济发展的新阶段,深入挖掘产业数据价值,从海量数据中提取知识,实现智能化的应用,是产业智能化的必由之路。在这个过程中,面临以下四大挑战:
1、数据海量
企业在数字化的过程中,产生体量巨大的数据,且数据规模不断极速增长,传统 IT 架构已无法应对。
2、数据形态复杂
企业存在大量的隐性知识,其专业性强、结构化程度低,行业数据呈现复杂化、多模化发展,这将给数据处理和知识挖掘带来巨大挑战。
3、数据利用率低
企业内部数据分布在不同的业务系统中,呈现碎片化、孤岛化的特点,存在大量冗余和噪音。传统的数据处理技术难以对这些数据和信息进行语义化的理解,导致数据的利用率低下。
4、应用多态
企业内部应用和业务系统纷繁复杂,传统的知识管理面临成本高、效率低、体验差等问题,知识应用缺乏系统化的能力。
为应对上述挑战,帮助企业实现智能化升级,百度智能云发布知识中台解决方案。该方案基于百度知识图谱、自然语言处理、跨模态内容理解等核心技术,提供面向企业知识应用全生命周期的一站式解决方案,覆盖企业的知识生产、知识组织、知识应用的全流程核心能力。百度智能云知识中台可通过应用组件、标准化产品、定制化服务、集成化方案等多种灵活的方式对外输出,助力企业高效生产知识,灵活组织知识,智能应用知识,全面提升企业运行效率和决策的智能化水平。
02 百度智能云知识中台背后的技术支撑
百度智能云知识中台助力企业智能化升级的背后,离不开百度强大的 AI 技术支持,如知识图谱、自然语言处理、知识增强的跨模态内容理解、面向多模态的复杂知识挖掘,以及知识增强的场景子图推理等。1、知识图谱
百度知识图谱经过近10年的发展,打造从通用到行业的知识图谱完整技术体系,构建了业界规模最大的多源异构知识图谱,目前拥有5500亿知识的多源异构超大规模知识图谱,除了基础的由实体、属性、关系构成的通用知识图谱,还针对不同应用场景和知识形态,构建了事件图谱、多模态图谱、行业知识图谱等多种图谱。通过持续获取和积累知识,认知能力和智能化水平不断升级,从而可以更好地支撑不同的应用场景。
为了解决行业应用中最后一公里的问题,百度智能云从架构机制、策略算法到平台流程进行全面的升级和优化,构建高效可迁移的行业知识图谱平台。该平台优势有:一是专业性强,面向专业复杂知识,实现基于超图的知识表达;二是效率高,支持低资源的学习机制,通过人机协同的方式,相对传统人工构建方式,效率提升百倍以上;三是可迁移性,实现从通用到行业,跨行业的多层次迁移学习,目前已覆盖一百多个行业场景。
2、自然语言处理
百度研发了世界一流的语义理解、语言生成、智能问答、智能对话、机器翻译等自然语言处理技术。2021年百度智能云发布“知识增强大模型”文心 ERNIE 3.0,该模型基于深度学习平台飞桨的分布式训练技术,首次在百亿级参数预训练模型中引入大规模知识图谱,一举刷新54个中文 NLP 任务基准,并在全球权威榜单“SuperGLUE”上排名第一。
3、知识增强的跨模态内容理解
百度自研知识增强的跨模态深度语义理解技术,通过知识关联跨模态信息,解决不同模态语义空间融合表示的难题,突破了跨模态语义理解的瓶颈,让机器像人类一样,通过语言、听觉和视觉等获得对真实世界的统一认知,实现对复杂场景的理解。
4、面向多模态的复杂知识挖掘
在知识挖掘层,针对行业多态输入数据,百度智能云知识中台基于 Prompt Learning 技术,对实体关系和事件等信息抽取进行统一建模和多任务训练,利用领域语言模型中蕴含的大量知识,使得模型具备良好的零样本迁移和小样本学习的能力,除了传统的本体以及简单的 SPO 三元组外,还可挖掘时序类、因果类、流程类等复杂知识。并针对从知识体系的设计到系统落地部署的全部流程,知识中台提供全链条按需定制工具,高效支持跨行业、跨场景的知识挖掘需求。
5、知识增强的场景子图推理
在知识中台的应用中存在大量的推理场景,因此除了推理的结果准确性要求外,结果的可解释性尤为关键。另外,行业场景需要随着情境的变化做连续推理,这对推理过程的逻辑性、一致性带来巨大的挑战。针对这些难题,百度智能云知识中台将数据与知识驱动相结合,首创知识增强的场景子图推理,运用子图来刻画情境,使结果更可解释、逻辑性和连续一致性。
基于以上强大 AI 技术加持,百度智能云知识中台帮助企业便捷地从数据提炼知识,通过搜索、问答、推理、可视化等方式高效地将知识应用,将分散在企业各处的知识进行集约化管理,起到凝练知识、赋能业务、助力企业提升智能化水平的作用。
03 揭秘百度智能云知识中台的机制
百度智能云 AI 产品业务部解决方案总监楚畅表示,企业数据知识化转型建设过程需经历数据治理、知识生产、知识组织、知识应用、知识运营环节。从整体来看,还可分成知识的生产、运用和运营等三大阶段。作为企业知识智能化中枢,百度智能云知识中台解决方案打造了数据接入、知识生产、知识组织、智能应用、运营管理模块。第一个环节是数据接入,百度智能云知识中台支持通过 API 方式或直连方式对接企业现有的数据平台、数据库、文档系统等数据源,来获取包括结构化、半结构化和非结构化等多源异构数据信息。使用灵活可配置的调度工具,支持一次性全量数据导入、分批分时配置导入数据、实时在线逐条读取数据。数据接入后,系统会对数据进行适配、加工、转换和分发等操作,形成知识体系。百度智能云知识中台支持单日十亿级数据吞吐量,可同时对接百万级数据源,做到数据分钟级的更新。
接入数据后,在知识生产环节中将接入数据加工成为各种各样的知识体系。百度智能云知识中台提供七大知识生产方式:知识图谱、问答知识、全文知识、标签知识、事件知识、多模态知识、因果知识生产等方式。
1、知识图谱生产
传统知识图谱生产由业务专家采用自上而下的方式对某业务领域的实体、属性、关系进行抽取和建模,形成 Schema 体系。百度智能云的智能知识图谱的生产,通过人机结合和算法驱动的方式,用 AI 算法模型来驱动和训练,可从企业沉淀的数据或文档里抽取生成初步的 Schema 体系,再结合业务专家进行少量的人工审阅、调整,可大幅提升图谱构建的效率。
百度智能云的知识图谱生产,一方面可大幅提升知识图谱的构建效率,另一方面是有时候业务专家没有考虑到的属性和实体,可以通过系统自动获取,有效完成细节补充,确保整个图谱构建结果更加完善和科学。比如在传统本体构建环节,靠传统方式由专家梳理整个知识体系与本体体系,周期需几周甚至大几周;而采用人机结合与算法驱动的方式,只需几天就能构建完成整个知识与本体体系。
2、问答知识生产
问答知识生产是通过系统自动到数据源中产生一系列的问答对,即问题和答案。将这种问答对作为知识的一种形态,存储在应用平台中,用于后续问答场景。
问答知识生产可细分为三种方式,一是将企业预先准备好的问答对保存在文档里,再导入到平台中;二是企业提供原始文档材料,系统自动用人工智能模型从材料里挖掘出可能的问答对,再结合人工检查来生成问答知识。三是阅读理解式问答,这是百度的在线实时阅读理解式问答生成技术,区别于前两种问答知识生产方式,做到在用户真正具体提出问题、搜索答案时,通过语义分析来理解问题,在线输出匹配答案。
3、全文知识生产
全文知识生产主要用于全文检索类场景。区别于传统全文检索方式,全文知识生产在数据导入阶段,除了可以生成传统的倒排索引外,还可以基于行业专业词汇训练行业相关 AI 模型,用模型从导入的数据源中提取信息,生成语义索引。在具体检索环节,传统全文检索方式是通过匹配文本关键字,去检索相关信息。而智能化全文知识生产,结合语义索引、文本相关性、倒排索引等,生成基础排序,再综合基础排序和文档的时间性、质量分析等指标,以及百度智能云在行业领域长期积累的词库,产生精确排序结果,即“精排结果”,从而得出最终搜索结果。全文知识生产方式使得基于文本匹配的传统搜索方式,进化为基于语义搜索的智能化方式。
4、标签知识生产
标签知识生产的第一个阶段是标签提取和优化,通过训练人工智能模型对样本数据标注,训练出相关人工智能的语义模型,后续 AI 模型从数据源里自动地抽取出标签,完善标签体系。第二阶段是基于标签体系做场景化应用。除了单独应用标签知识做分类外,还可结合上述知识图谱等的生产方式,更深度做个性化推荐操作。
5、事件知识生产
事件知识生产一般来说是从网页爬虫抓取事件新闻,再由训练好的 AI 模型和分析技术,从获取的事件内容里做语义分析,提取出与事件相关的实体信息、论元角色,从而构建出事件的关系脉络体系,后续从该脉络体系进行事件脉络的搜索、情报分析、智能写作等应用。
6、多模知识生产
多模知识生产是综合运用视频理解、图像分类、目标检测、语音识别、OCR 识别等多种人工智能技术,从视频中进行图像、声音、字幕等知识分析,进行知识理解、情景理解,构建出知识子图、结构化语义信息,用于后续场景化应用。
7、因果知识生产
因果知识生产是基于因果规律分析的智能辅助预测方式,通过“导致”“由于”“因此”等因果关系的词汇来挖掘上下文内容,再进行语义分析理解,形成多层次的因果传导关系,便于后续做辅助预测。基于该体系,进行某些场景化应用如分析股价下跌因果传导过程、电网断电后续影响等。
通过上述的七大知识生产方式,生产出不同种类的知识后,通过图谱链接,形成统一组织形态的有序组织体系,服务于企业搜索、智能知识库、智能推荐、智能客服、智能文档分析以及如流等通用型应用,全方位满足企业对知识应用的需求。此外,在知识运营环节里,楚畅建议应做好以下工作:一是内容运营,引入更多生态内容来补充整个知识体系;二是用户运营,通过话题讨论、推广活动来激励和活跃用户让主动参与到这个知识体系里。三是功能完善,我们在后续使用过程中不断迭代演进平台,建设 AI 模型训练、优化效果、进行策略迭代演进等。
04 百度智能云知识中台,助力行业智能化应用实践
目前,百度智能云知识中台在能源、医疗、金融、电信、媒体、政务等行业拥有丰富实践和落地应用,助力企业提质增效。在能源行业,基于我国双碳目标下,为推进企业生产过程智能化,培育新型生产方式,全面提升企业生产、管理和服务的智能化水平,百度智能云与国能(绥中)发电有限责任公司共同提出,用知识图谱对企业赋能,提供针对性解决方案。最终在知识图谱的技术加持下,打通了资金流、物料流、事件流等流程之间的障碍壁垒,建立不同系统之间的数据关联,全方面、全过程、全场景的对生产经营业务进行刻画分析,为作业成本法等财务比对分析提供帮助。其次,挖掘沉没的历史信息,完善岗位责任及与之对应的相关知识,建立符合特定单位管理需求的岗位知识管理体系,辅助完成上岗培训等人力资源管理业务。并建立智能办公网络系统,实现了知识智能推荐、数据即搜即得,提高企业办公效率。
在金融领域,百度智能云知识中台帮助某大型商业银行优化手机银行搜索,基于精排搜索和知识图谱,丰富手机银行的搜索场景,提升手机银行的搜索准确度,优化用户体验。协助用户通过搜索实现知识获取、精准交易辅助等功能,检测问题账户准确度达97%以上,满足多业务场景的需求。另外,基于百度领先的图计算和图数据库技术,帮助银行企业构建图推理引擎的金融风控系统。
在法律领域,百度智能云知识中台为上海某法院搭建智能庭审系统,有效提取争议要素,归纳诉求关键点,推演案件关键情形,准确95%+。基于案情语义的类案推荐,涵盖2800万判决书,案情相似度97%+。庭审材料结构化呈现,可解释推理量刑,庭审效率提升3~10倍。
在医疗领域,百度智能云知识中台通过辅助诊断等知识运用方式来服务于智慧医疗,实现数据与知识双擎驱动,提供智慧医疗解决方案。项目服务数超万名医生,触达27个省市、300多家医院和1500+家基层医疗机构,惠及患者数超过千万,累计服务人次2500万+。
05 AI+知识管理,开启智能工作新时代
后疫情时代,宏观经济形式剧变,企业适应变化需要变得更敏捷、可持续,企业需要更智能的新工作模式。 因此百度提出了以“AI+知识管理”驱动工作方式智能化变革的新理念,激发企业创新能力,提升企业核心竞争力。基于“AI+知识管理”理念,百度研发了新一代智能工作平台——如流。据百度智能办公平台部主任架构师和为表示,如流在百度智能云、百度 AI 中台和知识中台的支撑下,通过强大的 AI 和知识管理技术,深度赋能企业工作的各个环节。其核心是通讯流、工作流和知识流三大板块。通讯流聚焦人与人之间触手可得的连接,核心产品是即时通信和智能会议;工作流主打高效协同,核心产品是千人千面的智能工作台、工作卡和企业一站式应用中心;知识流的核心产品是智能知识库、统一搜索和智能推荐等。
在如流的帮助下,企业的知识经过知识创造、知识沉淀、知识流动和知识应用的环节,形成闭环,让企业的知识高效流转。以知识创造为例,如流通过一系列 AI 技术重塑了会议的全流程。在开会前,AI 助手自动协调参会人的时间,节约沟通成本;在会议中,通过实时语音识别技术将会议语音转化成文字,AI 技术自动识别出哪些是关键信息并标记;在会后,自动提取会议纪要,帮助人们总结会议待办任务,并智能分发给相关的人。不但会议全流程变得更高效,更重要的是,整个会议过程变得可沉淀、可回溯,会议成为知识创造的典型场景。
在知识沉淀方面,如流的智能知识库,拥有多人实时协同编辑的在线文档和企业网盘等基础能力。同时,部门知识库产品,支持以组织为基本单元实现知识的有序沉淀。此外,通过对知识库文档的深度语义理解,如流可以自动地把企业的员工、项目、会议、OKR 等各种实体有序关联起来,形成庞大的企业知识图谱。基于图谱可以推导实体间的关联关系,计算语义距离。
在知识流动方面,如流的知识星链产品,可以在会话沟通、文档协作中快速分发知识卡片,使企业知识在工作场景中高效流转,随时随地连接员工与知识。以智能工作平台如流为基础,可帮助企业实现工作模式的智能化升级。在 AI 技术的赋能下,通讯信息、工作和知识高效流动,无缝融合,员工能效迅速提升。同时,企业知识有序沉淀、快速流转,赋能并加快业务创新速度。
06 百度医疗知识中台,推动医疗行业智能化升级
在本次大会上,百度携手毕马威等合作伙伴重磅发布《医疗知识中台白皮书》,并邀请中华医学会杂志社领导出席发布仪式。医疗知识中台,能够帮助医疗机构、医疗从业人员、医疗健康产业机构等获取权威专业的医疗知识,满足快速搭建场景化应用的需要,帮助医疗行业智能化升级。百度医疗知识中台是遵循医疗逻辑的智能化开放平台,具备开放智能的医疗知识加工能力和开箱即用的医疗知识服务能力。同时专注于医学知识的生产、组织建设,通过基础工具抽取经典权威的医学教科书、专家共识、临床指南、路径规则标准等医学知识,经过加工后形成机器可识别的标准化医学知识,对外提供智能化医疗知识服务。百度医疗知识中台可作为医疗行业智能化升级的关键抓手,助力医疗行业发展。
医疗知识中台白皮书下载入口
作为企业将数据知识化、实现智能应用的中枢,百度智能云知识中台以科技创新促进产业创新,不断赋能金融、能源、医疗、媒体、政务等各行各业。期待在不久的将来,百度智能云能够携手更多合作伙伴,用知识中台助力更多行业实现智能化升级。还想了解更多百度智能云知识中台前沿资讯?访问链接,观看精彩回顾:https://cloud.baidu.com/techday/index