距离2022年11月30日,ChatGPT正式上线,马上2周年了。AI大模型的幻觉,治好了吗?
这两年,AI落地速度慢,跟2个难关脱不开关系:
一个是幻觉,或者说,AI能力到底有没有用,能否在产业级场景通过考验;一个是价格,AI带来的降本增效、商业价值,能否对冲部署AI的成本。
在百度2024世界大会上,李彦宏提出:大模型的幻觉正在消失。
「过去18个月到20个月的时间里,大模型领域最显著的变化,是回答问题的准确性。」李彦宏讲到。
打个比方,在一年前,你向聊天机器人提问,不管是查资料、订票、历史,你不敢完全相信它的答案。
因为AI有幻觉,可能“已读乱回”、胡说八道。这个问题怎么解决的?
在今年,大模型普遍联网,并应用RAG等检索增强技术。你会发现,现在AI机器人的答案,他们一般会援引内容来源,答案是经过多方信息验证的。
在实际使用里,你能明显感知出AI的准确度、可信任度在优化。
那么图片生成呢?
AI生成的图片、视频等多模态内容,也存在幻觉问题。比方说,生成的画面不够准确,不符合逻辑,风格无法统一。总之,就是一眼AI画风。
像这张AI生成的天坛图片,乍一看像模像样,但细节哪看哪不对。
世界大会上展示了一个,爱因斯坦在天坛前。
这是他们通过iRAG检索增强技术,将亿级图片资源用来加持大模型,得出的升级版文生图模型。
这样的图片,AI画风一下淡了,多了写实感、人味儿。
不仅如此,图片中的物品、人物、品牌logo……都可以精准生成,实现定制。这意味着什么呢?跟拍摄海报大片、广告比起来,AI制作成本几乎接近于0,对于行业的颠覆才敢刚开始。
我抓紧体验了一把,让文心生成:马斯克和特朗普,在中餐厅吃火锅。然后这张图就水灵灵出来了。大家可以评判下:
没有幻觉,AI的能力将真正在产业中开始裂变。
这2年,李彦宏是国内最活跃发声的AI企业家之一。他做出的一些“反常识”判断,在今天看,基本都被验证。比如说:
- 2023年8月,「百模大战」正如火如荼的时候,李彦宏指出:中国现在有好几百个基础模型,这是对社会资源巨大的浪费。尤其在我们算力还受限制的情况下,更多资源应该放在去探索跟各行各业的结合。
- 2024年7月,世界人工智能大会,他又说:避免掉入超级应用陷阱。不是只有10亿DAU的应用才叫成功,“超级能干”应用,比超级应用更加重要。在基础模型之上,应该能够诞生数以百万计各种各样的应用。
- 2024年9月,在百度内部讲话里,李彦宏又质疑:一天到晚跑分刷榜,谁又超越GPT-4了,明天又史诗级更新了。但是我要问,应用在哪里?谁从中获益了?
他的判断,跟本轮AI大模型爆发的时间线,3个阶段的演变基本吻合:
1、从ChatGPT发布到2023年年中,是第一阶段,特征是百模大战;2、2023年年中到2024年年中,是第二阶段,AI应用初步探索落地,行业掀起了价格战;3、2024年下半年至今,是第三阶段,AI应用深度融合、落地爆发,开始产生显著回报。
过去近十年,百度all in AI的战略布局,也终于在这两年迎来时代机遇,百度切换到了新的增长轨道。
从透露的最新数据看,百度文心大模型的日调用量已超15亿次,文心一言的用户规模突破4.3亿。
8月百度的Q2财报显示,百度智能云季度营收51亿元,同比增长14%,AI和大模型收入占比提升到9%。这也意味着,百度智能云是国内极少数能实现盈利的云厂商。
根据IDC统计,2024年上半年,百度智能云以32.4%的市场份额,位居中国MaaS市场第一;在2023年,百度智能云以26.6%的市场份额, 连续5年居AI公有云市场第一。
本次百度世界大会,主题词是“应用来了”。李彦宏说,我们即将迎来AI应用的群星闪耀时刻。
在他的预判里,接下来AI应用如何落地爆发、如何创新呢?
AI应用的爆发,李彦宏讲到了两个方向:一个是智能体,另一个是产业应用。
我们先看智能体。
李彦宏预判,智能体会是AI应用的最主流形态。
我认为,做智能体很像在PC时代做网站,或者是移动时代做自媒体账号。不同之处是智能体更像人,更智能,更像你的销售,像你的客服,像你的助理。智能体可能会变成AI原生时代,内容、信息和服务的新载体。
这个判断是有数据支撑的。在百度的文心智能体平台上,已经聚集了15万家企业和80多万名开发者。
这一次,他们根据使用度、用户喜爱度,把TOP100名的智能体也公布出来,让大家瞧瞧。
他们将智能体分为了4类:公司、角色、工具、行业。
在TOP100的图谱里面,有情感聊天智能体,有工具类应用,有娱乐型,还有像农民院士这样的专家角色智能体。
而公司类智能体是什么呢?比如说,比亚迪就有自己的智能体,它就像一个会说话的公司官网,能解答关于比亚迪和他们汽车的一切问题。
比亚迪官方智能体
李彦宏说,智能体最明显的特点是门槛足够低,谁都能上手,天花板又足够高,可以做出非常复杂、非常强大的应用。
好,再看百度另一个AI应用大方向,产业应用。
目前,百度智能云千帆平台,已经帮助客户精调3.3万个大模型,开发了超过77万个应用。
从具体服务的产业来看,百度智能云的AI已经在金融、工业、交通、电力、政务、教育、汽车等几十个行业落地。
目前,有超六成的央国企和大量民营企业正在使用百度智能云做AI创新;同时,像中小企业、高校科研机构,以及创业团队,也在借助百度AI转型。
百度在率先探索,一条AI落地、商业化闭环、协同创新的路径。
就拿大家关心的就业来说,AI能帮你更好地找工作吗?
智联招聘是国内最大的招聘平台之一。上面有3.6亿用户,1375万的企业客户。这是一个什么概念呢?
找工作的人,可能或多或少都和智联打过交道。
智联招聘的工作,简单说,就是让合适的人,找到合适的岗位。
在过去,这个工作是靠人工来完成的。所有的简历、岗位数据靠人工标注,求职者和HR每天时间都花在了筛选和沟通上。AI能帮这个环节做什么呢?
智联招聘和百度合作,通过百度智能云千帆大模型平台,打造出AI招聘助手。求职者和AI直接自然对话可以做到及时响应、回复;企业将岗位需求发给AI,马上就能筛选出符合要求的简历。
通过这种方法,智联招聘的人岗匹配平均准确率,高达93%,远超行业平均水平。
他们在成为最懂找工作的平台。
比如,大家常去吃的肯德基、必胜客,背后其实都是一家叫百胜中国的公司。
餐饮企业,如何使用AI大模型?百度帮百胜做了这几件事:
首先,就是利用AI分析市场数据,对门店选址进行评估。百胜旗下数千家门店的选址,都是由AI辅助完成。
在手机上,肯德基和必胜客的5.1亿会员,他们的浏览、点餐、会员服务,都靠数字化和AI帮助。
找过客服解决问题的,是不是都迫不及待“转人工”?因为机器客服太僵硬、模板化,无法处理千奇百怪的实际问题。
而百胜通过文心大模型,打造了自己的AI客服机器人,它最大的特色就是像“人”,能理解找上门用户的真实意图,给出相应的回复和对策,沟通也很自然。
百胜的AI客服现在每天要处理超过15万次的消费者沟通,而问题解决率高达90%。
这些都是实际的,通过AI降本增效、体验优化,直接创造的商业回报。
如果要再上点难度,AI的想象力边界在哪里?能否做出从无到有的创新?
今年10月,谷歌DeepMind创新人获得了诺贝尔化学奖,因为AlphaFold在蛋白质结构预测方面的贡献。
AI for Science的讨论一下火爆出圈。
但在大模型时代,所有的科研机构,都面临算力不足的困境。斯坦福大学的李飞飞曾说,美国高校所有算力加起来,还不够造一个GPT-3.5,这已经是好几代之前的版本了。
百度怎么解决这个问题?百度内部也有类似的蛋白质结构预测、药物分子和疫苗研发的AI算法。
但他们是和上海交大,以及生物医药公司合作,把算法、算力赋能给科研机构,让专业的人去做化学、医药、新材料等技术研发。
在世界大会上,百度直接发布了基于大模型的100大产业应用。
这个图谱里,涵盖了制造、能源、交通、政务、金融、汽车、教育、互联网等众多行业。是多年以来,百度跟各个行业合作,积累下的产业级的解决方案。
这其实,百度表明了自己的态度:
他们不是要当那个通吃一切的“超级应用”,反而是要把能力赋予出去,帮助更多行业和企业打造出数百万的“超级有用”应用。
从百度的上升轨迹,我们可以看到一个趋势:
大模型厂商之间,已经从模型之战,转变为工具平台之战。
意思是说,AI应用的落地已经有了路径,商业化得到了初步验证,之前轰轰烈烈的价格战也让成本一路下探。
接下来是AI应用快速爆发的阶段。谁能把大模型底座做厚,提供完善的AI基础设施、工具和服务;谁能把大模型应用做实,提供真正能干的应用生态。
这可能,比参数、刷榜的竞争,要更加关键。
一直以来,百度都是从底层硬件,到框架、模型和应用,进行全栈布局,并提供各个层面的能力。
百度能不能在做好工具平台,做好“赋能者”的角色?我们可以从三个层面去看。
一是算力的问题。
这个现实的困境无法避开。国外OpenAI、特斯拉和Meta,都已经在用英伟达的H和B系卡,建几十万卡级别的集群,代差会不会越拉越大?我们如何应对?
百度智能云的算力平台,是百度百舸,目前是具备了成熟的10万卡集群部署和管理的能力。
并且从用卡来看,百舸内是具有多种算力,凭借一云多芯、十万卡集群的部署和管理能力,可以为广大企业提供稳定、弹性、高效的算力。从数据来看,百舸能做到算力资源利用率高达90%,万卡级模型任务的有效训练时长提升到99.5%。
典型代表,就是汽车行业。在智能汽车的进程下,自动驾驶的推理和训练对算力要求极大,车企本身涉及生产制造、管理、研发、销售等环节也都在引入AI辅助。
二是模型应用的层面。
之前讲到,百度智能云的千帆大模型平台,提供完整的工具链、模型服务、产业应用。可以做到只需注入少量数据,只需低代码能力,就可以快速、低成本、大规模形成AI应用。
这个是靠百度过去十年,在各个行业里深耕,去解决具体场景、具体问题,所积累和抽象总结的经验、数据和know-how。什么意思呢?
比方说,在医疗行业,在工业制造里的很多场景,他们是高度专业的。行业本身也没有专门的数据,能够去训练开发。这存在的问题就是,哪怕要做一个工业巡检的应用,检查零部件,检查安全生产,看上去是很简单的场景,但需要专门训练视觉CV的小模型。用的时间很长,成本也很高,大部分工厂没有能力去做。
而现在,百度通过多年积累,在各个行业场景里,都积累了自己的解决方案,并可以通过大模型快速变成能力。现在要做一个巡检应用,直接用对应AI给少量工厂数据,马上就能规模化应用。
百度智能云总裁沈抖,就在现场基于千帆平台工作流Agent,快速打造了一个“车保金牌销售”。
比如说,购买车险,是一个车主们共同的麻烦,往往需要很长时间、细致、专业的车险咨询服务。
但是大部分保险销售,很难让车主满意,金牌销售毕竟是极少数。
那么好,国内有一家保险公司,就大胆使用百度的工作流智能体,把保险公司关于车险的知识、流程、销售经验,全部灌输给智能体。
只用一个小时,就能复刻出一个有金牌销售知识的AI销售。
在大会现场,沈抖就和这位AI销售进行了一场酣畅淋漓的讨价还价。
三是在更加长尾的,生态协同的层面。
这一点其实被很多人忽视了。
百度作为一家AI和互联网领域的公司,他们给自己定位是赋能者,提供工具和平台。
在这么多年和众多企业的合作,其实,就等同于是陪伴成长。这个过程里,各个行业、企业会形成自己的人才团队。
这批人才,既懂使用AI开发,又懂自己的业务和场景。
做研发的,可以专心搞实验;做销售的,服务好客户;做制造的,管理好每个环节……
让专业的人干专业的事。给他们AI基础设施、算力、开发工具,他们自己就能开发出真正满足行业需要的AI原生应用。
国内AI在技术突破上,速度并不慢,更可贵的就是我们全球独有的产业纵深、应用场景和企业规模。
随着AI应用的爆发,AI基础设施的完善,除了大企业在转型,我相信一定会出现很多「10个人开公司,干出现象级大生意」的案例;像蛋白质这一类创新研发的速度,也会加快;靠想法就能赚钱的时代,可能真的来了。
百度在押注自己最擅长的赛道,让AI技术普惠到更多行业,真正变成大家的技术红利。