让AI“上天”“入地”百度打开未来世界

懂懂笔记 2024-11-13 15:50:42

将大模型和生成式AI送到普通人手里,让大模型触手可得。

从ChatGPT问世至今,已经过去2年。大模型和生成式AI带给人们的,除了无限畅想,还有理想与现实的差距。

即便AI手机、AI PC、AI汽车相继问世;即便随便打开一个大模型,让AI搜集一些资料、扩展一篇文章,已经“So Easy”,但大多数人仍觉得“不解渴”。用一句话总结,人民群众日益增长的AI理想与AI现实之间存在巨大矛盾。

那么,如果从专业角度,该如何评价过去两年大模型和生成式AI的发展?

“AI先生”李彦宏11月12日做了总结:“大模型最大的变化是基本消除了幻觉,回答问题的准确性大大地提升,变得可用、可被信赖。”同时,他认为智能体是AI应用的最主流形态,即将迎来爆发点。

消除幻觉的一个标志性产品是百度自研的iRAG,将百度搜索的亿级图片资源跟强大的基础模型能力相结合,没有了幻觉,少了AI味儿。比如车企可以用iRAG生成宣传海报,还原真实的车型,再也不用画几十万去拍摄了。再比如马斯克在故宫旅游,不仅马斯克和故宫都能精准呈现,还能将人与场景非常自然地融合在一起。

作为国内大模型和生成式AI参与国际竞争的种子选手,百度在AI领域的进展值得关注。11月12日的百度世界大会上,李彦宏就重点介绍了百度大模型和生成式AI的当下进展以及未来空间。

陡峭增长,日调用量超15亿

北京上班的小徐,最近尝到了AI的甜头。因公司设计人员不多,且集中精力备战双十一,给领导做PPT的任务就落在他头上。可他只擅长文字工作,制作PPT是短板,心里犯怵。

经同事点拨,他知道了百度文库可以一键生成PPT,将发言稿全文上传后,就能生成个七七八八,再更换下配图、调整下文字图片大小即可。这可帮了他大忙,接到领导这样的任务,他再也不担心了。

百度文库的一键生成PPT功能背后正是百度文心大模型在发挥作用,小徐的每次使用,都需要调用一次大模型。除了制作PPT,用户每一次在百度App搜索智能体,每一次在文心一言问答,每一次用文心一言生成图文都会调用文心大模型。

除了C端用户,B端企业用户的数字人、智能客服等每一次服务用户,也都会调用一次文心大模型。这个调用量规模有多大呢?

李彦宏透露,截至11月初,百度文心大模型的日均调用量超15亿。这足以表明大模型已经深入用户日常生活。

更值得关注的是,日调用量增长的速度。李彦宏表示,百度内部曾讨论大模型的未来,“怎么才叫成了”。他当时说,如果文心一言大模型日均API调用量,一年之内涨10倍,从今年5月初的2亿到明年5月涨到20亿,就认为成了。因为这说明,大家是真的需要。

而目前,仅半年过去,就超过15亿,逼近20亿,这条超出百度预期的陡峭增长曲线,正是中国大模型应用大爆发的缩影。此外,文心一言用户规模达到4.3亿。

AI从量变迎来了质量时刻。

AI需求侧的爆发式增长,离不开供给侧的持续迭代。比如,百度研发了“理解—检索—生成”协同优化的检索增强技术。检索增强是大模型去幻觉,增强答案可靠性的主要路径,即用海量搜索信息指导内容生产,提高准确度。

再比如,服务程序员的智能代码助手文心快码升级至3.0版本,不仅功能开发、代码测试、问题修复等能力有所提升,还能实现多个智能体流水线协同,进一步提升程序员工作成效。

面向产业端,百度构建了文心大模型矩阵,包括ERNIE 4.0 Turbo等旗舰大模型、ERNIE Speed等轻量模型,以及基于基础模型生产的系列思考模型和场景模型,满足不同应用的需要。

当然,这更离不开百度AI先人一步出发。ALL in AI到李彦宏获评AI先生,百度几乎是国内唯一持续多年在AI领域做投入、开源、人才培养、生态共建的企业。10多年来,百度为人工智能和自动驾驶研发投入超过1700亿,聘请2024物理诺奖得主辛顿、吴恩达、Dario Amodei等全球科技领军人物,使得百度在大模型领域成为真正的扛旗者。

打开多个增长通道

AI正在重塑百度。除了大众知道的百度将旗下产品全部AI化以外,文心大模型还在至少三个维度为百度提供新的增长动力,由内到外改变这家公司。

一是智能体。这被李彦宏看作是AI原生时代,融合内容、信息、服务的新载体,类似PC时代的官网,移动时代的自媒体账号。与智能体紧密相关的是百度的搜索业务,以前用户百度搜索之后的结果页是官网或者其他SEO之后的内容,如今得到的更大概率会是智能体。

有何区别呢?以往,用户在百度App搜索比亚迪,通过首个结果进入比亚迪官网,自主浏览、查看。现在,搜索结果第一条是比亚迪智能体,变成了一个类似生成式AI的互动界面。用户可以问某款车型信息,多款车型对比,或者线下门店信息等,智能体可第一时间生成答案,告知用户。这种模式下,品牌与用户的链接更精准、高效。

在百度看来,搜索是智能体最大分发入口,智能体的爆发会使搜索成为AI时代的第一入口。数据显示,截至2024年11月,百度文心智能体平台已经吸引了15万家企业、80万名开发者入驻。

越来越多的智能体出现,将彻底改变原有的搜索体验,为百度赖以起家的搜索业务带来新的合作模式、盈利模式,打开新的增长通道。

二是百度智能云。近几个季度,百度智能云营收增长强劲、持续盈利,正是与大模型绑定的结果。因为大模型,解决了企业客户在AI时代的需求,带动了模型构建、算力消耗、接口调用等需求,并帮助企业客户催生了AI原生应用。

最初,云服务是解决企业客户信息化、数字化的成本问题、效率问题,更多属于CTO决策的范畴。后来,各个云服务厂商增加了行业解决方案,将云服务深入到企业经营管理各方面,涵盖了生产、销售、服务、管理等多个环节,帮助CEO解决问题。

在AI原生时代,企业客户迫切需要借助大模型工具,实现自身业务的重构。文心大模型与百度智能云结合,让企业客户应用AI、大模型的门槛降低,不仅仅是成本,还包括人员组织等多维度。

为实现这一步,百度在文心大模型旗舰版的3.5和4.0版本基础上,推出了5款轻量级/特定模型、AI原生应用开发工具AppBuilder等,帮助企业更低门槛、更高性价比的进入AI原生时代。

目前。百度智能云千帆大模型平台已帮助客户精调了3.3万个模型、开发了77万个企业应用。百度智能云也成为中国最大的大模型产业落地云,60%以上的央企,以及大量的民营企业,都在联合百度智能云进行AI创新。

三是自动驾驶。自动驾驶是百度面向未来,需要长期培养的增长点。在大模型的加持下,百度自动驾驶技术迭代更快,商业空间更大。今年,百度Apollo发布了支持L4级自动驾驶的大模型Apollo ADFM(Autonomous Driving Foundation Model),可以兼顾技术的安全性和泛化性,做到安全性高于人类驾驶员10倍以上,实现城市级全域复杂场景落地。 门槛越低,商业版图越大

纵观百度大模型近两年发展,明显朝着“上天”“入地”两个方向发展。

“上天”是不断优化大模型技术,持续迭代,提高竞争壁垒。不论从专利数量还是应用规模,百度在大模型领域都走在全球第一梯队。前不久,沙利文发布的《2024年全球AI生态全景概览》中,百度与谷歌、OpenAI等位于AI-Native Giant(AI巨头)同一序列。

“入地”是百度在不断降低大模型应用成本和门槛,让更多人触手可及。除了各种开放平台、开发工具,百度还亲自下场,为高校、企业培养了数百万的AI人才,让AI普及的速度越来越快。

本次百度世界大会再次体现了这两点。李彦宏在会上发布了两项新技术。

一是iRAG技术。回顾过去两年,李彦宏认为,文字层面的RAG(检索增强生产)已经做得很好基本让大模型消除了幻觉,即用户跟大模型一问一答,大概率能得到用户想要的答案。

但在图像等多模态方面,还存在较大幻觉,比如让大模型生成一张某历史人物在某景点的照片,还是存在“一眼假”的情况。要么是事实性错误,如人物张冠李戴,要么是画质“机器味儿”太重,缺乏真实感。

针对于此,百度开发了检索增强的文生图技术iRAG(image based RAG),将百度搜索的亿级图片资源跟基础模型能力相结合,可生成超真实的图片。这项技术拥有广泛应用场景,比如过往汽车品牌要拍一组海报大片,动辄要大几十万,应用百度iRAG,可立刻生成,且成本几乎等于零。

这是百度不断“上天”,向技术高峰攀爬的行动。当天,李彦宏还重点介绍了计划明年一季度上线的无代码工具“秒哒”,是百度不断降低大模型门槛,“入地”的体现。

“秒哒”可以说,满足了大多数人对于大模型和生成式AI应用的想象,即不需要懂编程,只需要说出想法,AI就能实现和生产所需要的应用。

具体如何实现?用户只需对准秒哒用中文描述需求,如需要搭建一场活动的在线报名系统,并上传活动时间、地点等信息。之后,秒哒会自动调取多个智能体、多个工具,实现程序的开发、BUG检查、视觉设计等工作,完成报名系统的开发。也就是说,只要有想法,你就可以心想事成,这也将迎来一个前所未有的只靠想法就能赚钱的时代——点子时代。

当一个复杂的事务变得简单化,将是其走向千家万户,占领大众市场的开始。比如微软的可视化桌面系统取代Dos系统,让普通人可以使用原本复杂的计算机。而“秒哒”的落地,意味着将开启一个全新的点子时代,这才是AI真正的价值所在。

“秒哒”正是这样一个工具,让每个人都变成程序员,将极大提高AI原生应用的生成效率,带来更多智能体,进一步繁荣AI生态。而百度作为这一生态的主要创建者,未来的获益无需多言。

【结束语】

作为全世界最成功的快消品之一,可口可乐的成功有其独特配方、成功的营销,还有重要的一条,即建立了全球最大的饮料分销系统。2019年其已在200多个国家建立超30000万个销售网点,覆盖了全球约60%的零售店。这样的结局是,世界各地的人们触手可得可口可乐。

当前的百度正在做类似的事情,将大模型和生成式AI送到普通人手里,让大模型触手可得。AI的普及和商业化自此打开,百度更广阔的未来世界也被打开。

0 阅读:0