4月16日,百度创始人、董事长兼首席执行官李彦宏在Create 2024百度AI开发者大会上,发表了“人人都是开发者”的主题演讲。他指出,“AI正在掀起一场创造力革命,自然语言将成为新的通用编程语言,未来开发应用就像拍个短视频一样简单,人人都是开发者。”
如今,得益于愈发强大的基础大模型,开发者的生产力大大提升。例如,基于文心大模型的智能代码助手Comate在一年多的时间里,就已走入了喜马拉雅、三菱电梯、软通动力等上万家企业,百度每天新增的代码中,已经有27%是由Comate自动生成的。
连发多款AI开发工具大会上,百度向大家分享了三大“开箱即用”的AI开发工具,包括智能体开发工具AgentBuilder、AI原生应用开发工具AppBuilder以及各种尺寸的模型定制工具ModelBuilder。
AgentBuilder:智能体开发工具在现场,李彦宏展示了新加坡旅游局、启德教育和索菲亚三个智能体案例。
启德教育利用百度的AgentBuilder打造的专属智能体在上线第一周,就成功实现了155万次分发,5.8万次用户交互,线索转化量直线增长、有效线索的转化成本明显降低,经营效率大幅提升。而索菲亚商家智能体则自从上线以来,降低了30%的有效线索成本。
在百度AgentBuilder的帮助下,每个商家、每位用户都可以轻松拥有专属智能体。李彦宏认为,智能体可能是未来离每个人最近、最主流的大模型使用方式,基于强大的基础模型,智能体可以批量生成,应用在各种各样的场景。截至目前,已经有3万多个智能体被创建、5万多名开发者和上万家企业入驻。
AppBuilder:AI原生应用开发工具据称,百度此次推出的AppBuilder是“目前最好用”的AI原生应用开发工具,它具有两大绝对优势:
功能强大。依托文心4.0对指令的理解和遵循能力,AppBuilder在冷启动的情况下就可保证运行效果;并且,通过依托检索增强生成技术(RAG),该工具的准确率和友好度都达95%以上,远超同类产品。简单易用。百度提前在AppBuilder封装和预置了开发AI原生应用所需的各种组件和框架,大幅降低了开发门槛。只需使用自然语言,三步(名称设定、填写角色指令、插入组件)即可快速创建应用、一键分发;另还支持开源的SDK,方便二次开发。ModelBuilder:模型定制工具百度方面称,ModelBuilder是专门针对专业开发者研发的“高效低价生产模型”,可以根据开发者的需求定制任意尺寸的模型,并根据细分场景进一步精调SFT,从而达到更好的效果。
会上,李彦宏特地展示了该工具在教培行业的具体应用。经过数据处理、模型精调后的“作文批改助手”,不仅在教师点评、格式纠正方面更加专业,而且比未精调的模型更接近真实分数。
除以上三大新品以外,百度集团执行副总裁、百度智能云事业群总裁沈抖还发布了百度智能云万源全新一代智能计算操作系统。该系统兼容了各类大模型,能充分满足业界的大模型使用需求。
“百度踩了无数坑”对于百度基于大模型开发AI原生应用的具体思路,李彦宏表示:“这是百度根据过去一年的实践,踩了无数的坑,交了高昂的学费换来的。”
第一是MoE。李彦宏认为,未来大型的AI原生应用基本都是MoE的架构(大小模型的混用),从而摆脱了一个模型“孤军奋战”的境地。
第二是小模型。推理成本低、响应速度快的小模型在特定精调后完全可与大模型相媲美,因此,百度接连发布了Speed,Lite、Tiny三个轻量模型。
第三是智能体。随着智能体能力(理解、规划、反思和进化)的提升,将会有越来越多的AI原生应用涌现出来。它们可以自主完成复杂任务,在环境中持续学习、实现自我迭代和进化。在复杂的环境中,它们甚至可以相互协作以高质量完成任务。
百度AI和大模型新动向根据发布的数据,文心一言自去年3月16日发布以来,用户数已突破2亿,API日均调用量也突破了2亿,服务客户8.5万,千帆平台AI原生应用超19万。在他看来,文心一言模型已经成为中国最领先、应用最广泛的AI基础模型。
在过去的一年里,文心大模型从3.0到3.5,又升级至4.0版本,该版本在理解、生成、逻辑和记忆四大关键方面都达到了业界领军水平。具体看来,文心4.0的算法训练效率提升到了原来的5.1倍,周训练有效时间可达98.8%,推理性能提升了105倍,成本降至原来的1%。也就是说,客户原来一天调用1万次,同样成本现在可以调用100万次。
针对这一发展,文心大模型4.0工具版在大会上正式亮相。该版本引入了代码解释器功能,只需要通过自然语言的交互,就可以处理与分析复杂数据及文件,并形成相应的图标文件,从而更快地洞察数据特点、分析变化趋势,为后续决策提供支持。
不过,李彦宏认为,开源模型会越来越落后。
“有了文心4.0之后,百度可以根据需要,兼顾效果、相应速度,推理成本等各种考虑,剪裁出适合各种场景的更小尺寸模型,并且支持精调和post pretrain。比起直接用开源模型调出来的模型,通过降维剪裁的模型在同等尺寸下效果更好、成本更低。”李彦宏解释道。
在他看来,大语言模型本身并不直接创造价值,而基于大模型开发出来的AI应用,才是能够真正满足市场需求的东西,而闭源才是盈利的真正道路。