“检索+生成”或将拉开新一轮搜索革命。
文丨海克财经 齐介仑
火遍全球的聊天机器人模型ChatGPT,在上线近1个半月之后依旧热度不减,但更多冷静分析乃至警惕动作已开始出现。
深度体验过ChatGPT的网友都能大略感受到,这款由美国知名人工智能公司OpenAI研发的生成式AI产品,总体表现堪称惊艳,官宣用户5天暴增百万,搜索引擎被颠覆说也随之而来。
据《华尔街日报》报道,OpenAI最新估值已由2021年上一轮融资时的140亿美元左右翻倍至近日290亿美元。与此同时,ChatGPT因其所提供内容的准确性和安全性等问题遭遇抵制。
据《华盛顿邮报》等多家媒体报道,美国纽约和洛杉矶已分别在公立学校和全区禁用了ChatGPT,费城等地则在密切跟进该产品对学生群体施加的影响,以便做出进一步决定。
被打上了革命性进步标签的ChatGPT有着极其耀眼的一面,但它无疑还处在早期探索阶段。至少就当下状态而言,它还远远无法被用户视为一款真正可信赖的信息获取型工具用于严肃日常,更遑论对越来越智能的主流搜索引擎的颠覆;至于产品之外诸多复杂问题的解决则更为任重道远。
事实上,百度在AIGC即生成式AI方向,基于过往积淀,早已建立起了全球领先优势,而且先行一步将其应用到了搜索上。
自2021年即发力生成式搜索的百度搜索,日前宣布将基于百度自研模型,升级其生成式搜索能力,以更好地回答用户的开放式搜索问题和更好地满足用户对定制化创作内容的需求。
通过对“检索+生成”这样一个耦合模式系统的打造,百度搜索或将稳健拓出一片相较ChatGPT远要宽广的天空。
01战略早已先行ChatGPT 2022年11月底甫一发布,便引起轰动,原因在于其人机对话和文本输出能力的强悍,而这一切高度仰赖全球AIGC前沿技术突破,特别是OpenAI自2015年12月成立以来在该领域的掘进。
与建立在创作者能力基础上的UGC、PGC等内容生成模式不同,AIGC的内容产出源头是人工智能,它是人工智能发展到一定阶段的产物。近年屡被提及的AI绘画、AI作诗、AI作词、AI作曲等莫不如此。
无论是用英文还是用中文,网友在注册之后,都能与ChatGPT展开互动。ChatGPT不但能够快速响应,而且博学多知、表意流畅,多轮对话中它还能纠正自己前面交流涉及到的错误并表示抱歉。
当然更具话题性和想象力的是,当用户输入一些难度系数颇高的带有诸多限定条件的指令,诸如替自己写一篇工作总结、给某个朋友写一封信、为某个功能写一段代码时,ChatGPT也常常能够给出一个令人赞叹的答案,一个无所不能的超级AI助手看似已经横空出世。
在Twitter、微博、微信朋友圈,与ChatGPT做过此类互动测试后分享截图并附高度评价的网友所在多有。OpenAI发起人兼早期投资人之一马斯克亦沉迷其中。马斯克在2022年12月4日发出的推文中对ChatGPT的优异表现惊呼好得可怕,并称人类已离强大到危险的AI不远了。
生成式AI的大热也让百度AIGC得到了强光投射。国内很多颇具民族自豪感的热血青年为此感到振奋并对百度充满期待。
以搜索为根基的百度,众所周知是一家有着强大互联网基础的领先AI公司。在2000年1月创立迄今的二十多年里,百度持续投入科技研发,其在人工智能领域已摸爬滚打逾10年,累计投入超过了1000亿元,为AIGC提供底层技术支撑的人工智能芯片、深度学习平台、预训练大模型等是其重点投入方向。
目前百度已推出兼具超强算力和高性价比优势的自研芯片昆仑芯片,自主开发的产业级深度学习平台飞桨平台,百度文心大模型则面向语言理解和语言生成等NLP场景不断进化,现已具备超强语言理解、对话生成、文学创作等能力;在具体产品上,AI绘画、AI图文转视频、数字人等均已落地并已在为创作者提供帮助。
涵盖百度APP、百家号、智能小程序、好看视频等众多产品和业务的百度移动生态,是百度集团三大增长引擎中的第一引擎,同时也是百度AIGC等人工智能技术落地的首站,搜索场景首当其冲。
百度的使命是用科技让复杂的世界更简单,简单是个重要关键词。习惯了百度简单风格的用户对其技术升级往往察觉不多,但其润物无声的演进一直在发生。
背靠百度AI能力,月活跃用户数已达6.34亿的国民级应用百度APP,搜索业务越来越懂用户,而这为其AIGC再下一城打下了坚实基础。
02更高维度比拼百度此次升级的生成式搜索,显然与ChatGPT差异颇大。百度做的是一个“检索+生成”的系统,而不仅仅是一个生成的模型。这个区别非常重要,它源自百度对搜索用户真切需求的理解。
ChatGPT能言善辩,定制化生成的文本也大多自成逻辑。但如果我们稍稍加以推敲就会发现,很多表面看起来无懈可击的回答和创作里,实则硬伤颇多;而沿着错误信息展开的论述,也就更加站不住脚。网友问“如果你是贾宝玉,你选择谁当老婆”,ChatGPT选择“贾母”并予以解释,即为一例。
据海克财经了解,受限于技术瓶颈的ChatGPT,目前还无法做到实时信息融入,其内容准确性等问题因此无解。
作为搜索引擎的百度,则是以信息的准确安全供给为第一要务。百度生成式搜索能力升级的目的也在这里。
对于当下互联网用户而言,搜索已是如同水电煤一样的基础设施型服务,而用户对搜索的刚需近年并未因为一些新产品的出现而在规模上有所衰减。以百度为例,过去一年,百度搜索规模在相当大体量的基础上年同比增长17%,继续稳居全球最大中文搜索引擎领先位置。
如今移动互联网的强劲渗透已令搜索变得随时随地,用户打开百度APP等工具后搜索的内容和方式也在变化。具体来说,搜索框键入关键词的方式已不再唯一,语音输入、图片搜索等越发多见,而且用户问题可能涉及多轮,精准判断用户需求和快速给出最佳答案已经变得更加重要。
百度搜索所确立的“检索+生成”模式,检索是前提,生成是补充,生成能力的接入为的是让用户搜索需求的满足更到位和更高效。
能力升级后的百度生成式搜索,互动内容兼具信息的准确性和文本的灵活性,近于ChatGPT与搜索引擎的融合互补。该升级功能将在更通用场景更深度应用,以满足用户愈加多元的搜索需求。
生成式搜索的进化尤为考验背后基座模型的能力。1月10日,百度举办Create AI开发者大会,百度介绍了百度搜索的两项“杀手锏”技术——跨模态大模型“知一”和新一代索引“千流”。
跨模态大模型知一,能够理解全网文本、图片、视频、结构化信息等形态各异的资源,进而打破它们之间的界限,把最满足搜索需求的结果呈现给用户。这与人类面对面交流时需要全面调动视觉、听觉、触觉、嗅觉等感官来回应对方并无二致。
具备跨模态、大规模、高效率三大特征的知一,目前可日均完成1万亿次推理、1万亿次在线预估,可日均处理千亿综合语料和百亿视频语料;百度自研成果,包括以量化和蒸馏为代表的模型压缩和预估优化技术,以及昆仑芯片和飞桨平台,都能够为该大模型的落地保驾护航。
具备动态适应和准确高效两大优势的新一代索引千流,实现了对搜索引擎后端架构的彻底改造。
如果把搜索比作去商场购物,那么千流就是商场里高度数字化的超级货架,上架商品已全部按照种类、成分、产地等维度进行了分类,一旦用户发出搜索请求,平台可快速圈定范围并能直达所需,而不必遍历全盘。据称百度有了千流之后,索引的单位成本降低了50%,索引的计算速度提高了一倍以上。
03空间不止于此百度在用户中间有着牢固的搜索心智,而百度搜索已是百度AI技术规模最大的应用场景,百度AIGC能力在百度搜索业务里有着充分体现。
我们从百度搜索以往技术迭代轨迹中不难发现,平台与用户之间是相互激发彼此成就的关系。具体来说,很多产品和功能的上线与优化,来自平台对用户需求的捕捉和满足,用户需求催生了平台技术的发展,而平台技术的发展又刺激了用户需求的释放。
百度生成式搜索的诞生与升级也是如此。
百度生成式搜索在运行原理上可简单理解为,给一位极具学识的高智商人士一个百度搜索引擎,用户发出搜索指令后,他能够快速检索和梳理信息,然后对筛选出的权威准确信息,基于推理,加以组织,最终形成一个结构性的高质量搜索答案。升级后的生成式搜索则在信息整合、内容创作、个性化体验等方面都将更为出色。
举个例子,秦始皇和汉尼拔这两位历史名人,谁的年纪更大一些?这个问题其实并不复杂,但按照以往搜索的逻辑,需要分别搜出两人出生年月,比较一下,得出结论。而基于生成式搜索能力,百度搜索可依据二人出生年份信息,直接给出“秦始皇年纪更大”的结论,还会提供二人具体出生年月和岁差等相关信息。
类似的例子还有很多。比如,北京和上海,GDP谁高?以前用户无法直接搜出结果,他需要知道国家统计局官网有这些数据,然后搜出网站,找到它们,再进行比较。效率太低,而且不是人人都能做到。现在百度搜索在技术优化基础上,对这些问题已可生成精准答案,搜索首位到达,且为可视化呈现,用户体验大为提升。
生成式搜索还将大幅升级内容创作能力。当你搜索“社区的活动通知公告怎么写”时,搜索引擎将直接“写”出一篇,呈现在你眼前。
除了常规图文视频,百度AIGC还能生成3D化AR形式的内容。有网友想了解台北故宫馆藏珍宝玉石红烧肉,但又不能亲赴当地。AIGC可派上用场。百度搜索基于早前众多博主现场拍摄的各个角度的视频,能够生成该文物的一个AR形象,满足用户所需。
AIGC的能力不止于此。
百度集团资深副总裁、百度移动生态事业群组总经理何俊杰谈到,未来10年,AIGC将颠覆现有内容生产模式,可以实现以1/10的成本,以百倍千倍的生产速度,创造出有独特价值和独立视角的内容。
百度旗下多款AIGC产品,如AI绘画平台文心一格、数字人度晓晓等,已在业界渐渐打响品牌。
以度晓晓为例,这款由百度在2020年9月推出的数字人产品,曾在2022年6月直播挑战写高考作文,40秒写了40篇,随机抽取其中任何一篇,得分都排在总考生的前25%。目前度晓晓用户黏性越来越高,技术能力越来越强,有望很快应用到手表、车载等多种场景之中去。
百度搜索在AI生成内容的成本上,相较ChatGPT,也有着明显优势,而且据称接下去还有大幅下降空间。
近年备受关注的AIGC,已打开一扇通往未来的大门。就当前技术和产品推进情况看,AIGC距离成熟尚远,创新机遇仍多,市场潜力还极其巨大。已厉兵秣马多时的百度正逐步迎来收获期。