2024,大模型的iOS时刻

极客公园 2024-09-27 21:45:16

科技史的组成,是几百年间一个又一个决定性时刻的串联。

2010 年 6 月 8 日凌晨一点,美国旧金山 Moscone West 会展中心的苹果发布会上,一身黑 T 恤蓝牛仔的乔布斯正式登台,他手握的 iPhone 4 自此成为跨时代的产品设计,凭借新理念的工业设计、500 万像素摄像头和视网膜显示屏以及 Facetime 视频通话等 100 多项新功能,这场发布会演讲,数次引起台下雷鸣般的掌声。

伴随着「very change, much wow」就这样改变一切的口号,全世界范围内的移动互联网浪潮就此拉开序幕。

不过,iPhone 4 改变世界背后,硬件的革新只是表象,所能影响到的,不过苹果与苹果产业链上下游,以富士康为代表的代工厂们。

真正让 iPhone 4 发布成为全球历史性一刻的,是 IOS 的推出,以及此后几年间安卓系统的快速跟进。开放的操作系统,让手机脱离了单纯的电话、拍照、播放音乐的功能限制,全世界软件企业的共同参与,进一步延伸了手机的边界,也孕育了 Facebook、TikTok、微信、美团等一大批超级应用,世界自此跑步进入移动互联网的时代。

应用决定想象力,成为新的行业铁律,而这条铁律,也正一点点在 2024 年的大模型时代再次被验证。

技术在不断进步,但商业模式,却总是踏着相同的韵脚不断重复。没有人会怀疑,大模型,正进入自己的 iOS 时刻。

01 创造大模型时代的明星产品经理

移动互联网的诞生初期,2010 年前后,曾经有一本爆款图书面世《人人都是产品经理》。

书中传达的理念,一时之间,给了无数求职无门的文科生们指出了一条新的职业方向。只是很快,大批涌入的文科生们就发现,产品的设计理念与技术的可行性是两回事;产品功能的实现,也始终离不开对代码底层逻辑的了解,《人人都是产品经理》不过是出版商为了卖书,使出的修辞手法。

一众大模型企业是否有从这本书身上取到经不得而知,但门槛降低才能生态成长的理念的确一脉相承:在大模型时代,代码能力,不再是影响产品创意的决定性因素,理念设想到产品落地,中间也仅需与 AI 的不断对话。轻装上阵,成为这一时期的大模型落地关键词。

第二届百度「文心杯」创业大赛正是这一现状最好的观察切口。

作为国内大模型领域最高规格、力度最大的创业大赛,百度「文心杯」创业大赛至今已连续举办两届。本届比赛,更是直接吸引了近 1600 个项目报名,其中,利用 AI 原生应用项目占比,更是从去年的 8 成提升至今年的超 9 成。

其中,值得一提的是,在本届文心杯的参赛团队中,超过 30% 参赛团队没有专业程序员。

就以本次比赛的二等奖获得者 Kotoko 虚拟角色社交互动平台来说,这是一款 AI-Native 社交游戏(类 AI 版模拟人生),应用底层基于 Multi-Agent 架构,可以实现环境-角色以及角色-角色的智能化互动,用户可创作个性化 AI 角色,体会与亲手创建的「纸片人」建立连接的快乐。其 CEO 是出身于商学院与投资人背景的 97 年创业者。而 CPO,则是 95 年出生,毕业于伦敦艺术大学,擅长游戏系统策划。

Kotoko:虚拟角色社交互动平台|来源:百度

与开发门槛降低伴随而来的,是应用创新的广度增加。

数据显示,去年的文心杯,还有约 30% 的参赛项目集中在通用办公及营销领域,今年参赛方向更加多元,涵盖文娱、电商、营销、医疗、办公、硬件、企业服务等等千行百业,整体的交付质量,也从过去的可能性展示,变成了真正的产品级交付。

比如一等奖,极睿科技,其产品定位于一站式电商素材 AI 工具,面向电商场景,为消费品牌提供覆盖图文及短视频的 AI 内容生成、管理工具及转化服务。

极睿科技:一站式电商素材 AI 工具|来源:百度

获奖项目水母智能则在 AI 绘画的基础上更深入一步,定位为 AI 漫画/漫短剧创作工具及内容平台,基于自研 AI 漫画生成工具链来赋能创作者,打造创作者社区和内容平台。当前,社区内累计的 AI Native 创作者已达 200 万,累计创作 1 亿+作品;并与国内外头部发行平台、网文平台等建立合作关系,已获得独家网文 IP 150 个。

水母智能:AI 漫画平台|来源:百度

技术的成熟,抹平了代码能力的差距,数量的爆发,带来了应用在千行百业的落地。此时此刻,摆在新时代开发者眼前的,似乎只剩行业经验这一道最后的鸿沟。

02 生态意味着什么?

大模型不是万能的,正越来越多的成为共识。

体现在技术侧:以百度为代表,越来越多的大模型头部玩家,不再过分强调模型性能的领先,转头讲起了生态与低门槛的故事。

而体现在应用开发侧:市场需要商业级交付,讲述大模型能做什么的美好期许前,承诺「我们的产品」可以帮用户解决哪些问题,成为竞争中新的赛点。

依旧以前面提到的做 AI 漫画的水母智能为例。漫画行业有一个定律:只有前 5%-10% 的内容是盈利的,盈利的前提漫画的品质做到 A+和 S 级。然而,中国能达到 A 级能力的主笔只有 200-300 位,能到助理水平的画师,也仅有两千到三千位,但市场中每年毕业的美术专业的大学生新增数量,却数以万计。

而在这一背景下,人们对大模型的期待,就不只是简单会画图,而是会画 A 级漫画,能用商业级产品,切切实实的为企业降本。

比如,产品应该是专业级的一体化的工作台,使用产品时,不需要像 SD 那样左右横跳,从文生图到图生图,又条件生图。

其次,漫画不同于单张图片,需要保持画面主角的一致性,对姿势、表情、特效等等的细节要求也更为苛刻:比如,同样是拥抱,但到底是熊抱还是抱头、抱腰,在 A 级变化中是有严格要求的。

而解决这些问题,大模型只是整个企业工作流中的一环,能完成人物的一致性,可以提供高级训练工具的企业,才是真正的赢家。

类似的情况,也发生在做 AI 心理诊疗的镜象科技身上。看起来 AI 心理诊疗,不过是聊天模型的翻版,但是 AI 其实并不能理解人的情绪,只能在行为和表达层面去进行计算推理。

镜象科技:基于大模型的专业心理诊疗 AI 智能体|来源:百度

而人类情绪复杂,常规的分类就有 18 种,最细的颗粒度甚至可以到 100 多种。除此之外,人的人生事件也可以被分成上千种,就算读书、毕业,也能分成十几、二十种不同的情况。

而这些精细的数据,并不存在于公域的互联网,反而是创业公司或者专业心理诊疗机构的核心壁垒。为建立数据库,镜象科技招募了十几个临床咨询的博士,花了两三年时间,不断收集生产数据,然后基于此进行训练,这才让最终的模型表达方式和回应方式,更像一个真实的心理咨询师的表达。

竞争的主战场,重新从技术被拉回传统赛道中的经验与数据积累,然而一个新的问题也随之产生:既然大模型不是万能的,那么百度承担的角色是什么?

03 从文心大模型到智能体生态,百度的基础设施蓝图

移动互联网时代,最大的增量机会出现在移动应用开发,但生态的繁荣,也进一步反哺,成为了苹果万亿市值的底座。

类比 iOS,成为大模型时代的基础设施,或许是关于百度,在大模型时代最精准的定位。

而这个定位,则要从技术、成本与生态三个角度来展开。

技术层面,在 ChatGPT 尚未面世的 2019 年,百度就发布文心大模型 1.0 版,历经四年多的技术深耕和研发迭代,文心大模型已经升级到 4.0 版。其中,2024 年 6 月,WAVE SUMMIT 深度学习开发者大会 发布的文心大模型 4.0 Turbo,则通过数据、基础模型、对齐技术、提示、知识增强、检索增强和对话增强等核心技术的持续创新,以及飞桨文心的联合优化,成为目前市面上性能第一梯队的大模型产品。

与此同时,针对那些对成本要求更高的客户,5 月,百度将 ERNIE Speed、ERNIE Lite 和 ERNIE Tiny 三款轻量模型免费;7 月,百度又大幅降低了文心大模型 3.5 和 4.0 两款旗舰模型的价格,将大模型的使用成本一降再降。

但文心大模型针对的,依旧是那些已经具备成熟技术开发能力的企业,如何让大模型能被更多没有经验的产品经理、传统行业从业者,甚至小学生使用,其实还需要更低的门槛,比如成熟到几乎没有门槛的开发平台,而这则需要千帆与智能体生态的共建。

对应到产品上,则是今年百度 Create 大会上百度发布的三个产品,AgentBuilder、AppBuilder、ModelBuilder。其中,AgentBuilder 作为基于文心大模型的智能体构建平台,通过提供的零代码与低代码开发模式,能够大大降低智能体的开发门槛,即使是没有编程基础的小白,也能仅用「一句话」就创建智能体。

至于为什么是智能体,李彦宏曾经对大模型的发展阶段做过一个三阶段预判

「一开始是对人进行辅助,最后出来什么东西需要人把最后一道关,我们确定它的效果是 OK 的,各方面都不错才会让它出去,这是 Copilot 阶段;再往下走就是 Agent 智能体,外界对于 Agent 有各种各样不同的定义,最主要还是说它有了一定的自主性,具备自主使用工具、反思、自我进化等能力;这种自动化程度再往下走就变成一个所谓的 Al Worker,能够像人一样做各种各样的脑力和体力劳动,各方面的工作都可以独立完成。肯定要有这么一个过程。」

其中,智能体的意义,在百度文心杯创业大赛颁奖视频致辞上,李彦宏再次做了补充:「智能体相当于 PC 时代的网站和自媒体时代的账号,它最明显的特点是门槛足够低,谁都能上手,天花板又足够高,可以做出非常复杂,非常强大的应用。我认为,将来会有数以百万量级的智能体出现,形成庞大的智能体生态。」

通过文心大模型+千帆平台等 AI 基础设施作为应用开发的根基,智能体进入人人可开发时代。

数据显示:百度 2024 年 Q2 财报数据显示,目前,文心大模型日均调用量超 6 亿次,日均处理 Tokens 文本超 1 万亿,与 23 年 Q4 公布的 5000 万次日均调用量相比,半年增长超 10 倍,日均调用量和日均处理的 Tokens 数均为国内最高。

04 大模型 iOS 的最后一块拼图——分发

很长一段时间里,百度内部都有一个讨论:做大模型的企业不少,其中不乏云计算公司和一众同规模的大厂;而发掘优秀大模型创业团队,风投也能做到。

那么百度,与风投以及其他企业的区别是什么?

答案是对标 iPhone,百度不仅有技术和生态,更能让开发者赚到钱。秘密就藏在百度的智能体分发生态中:搜索场景,正是智能体最重要的落地方向;贴吧、文库、百度知道、爱奇艺,则是各种垂类智能体最精准的应用场景。

据统计,智能体在百度生态的分发量 7 月日均分发次数已经超 800 万,是 5 月的两倍。此外,在百度开发智能体的商户已达 1.6 万家,覆盖教育、法律和 B2B 等行业。其中,最常用的智能体包括内容创作、性格测试、日程规划等类型。用户、开发者、服务商、商户均为智能体生态的重要参与方,

最典型的例子是百度在 6 月推出的高考智能体,可满足不同考生的个性化需求,帮助他们选择大学和专业。高考后,该智能体的日活跃用户峰值接近 200 万,实用性受到认可。

前文提到的水母漫画,不仅借助文心大模型,重塑了工作流,干掉了 50% 的决策和环节,降低了 62% 的成本,AI 漫画还上线了百度的移动端,然后百度的上游 IP,百度的网文也成为上游的 IP 供给方。

而对镜象科技来说,去年底开始就和百度 MEG 开启了业务的合作,今年还将继续推进大搜索、网盟以及 HCG 健康合作。比如,用户在搜索场景中,搜一些心理学相关的问题或者关键词,会调起在搜索中原生的智能体,由镜象科技提供的内容来回答用户搜索的问题。

至此,百度不只是帮助企业完成智能体搭建,同时还帮助企业完成了智能体落地的最后一环,分发与赚钱。

尽管,相比研发大模型,全球领先,比赛中做一个漫画工具,心理诊疗 agent,似乎并不性感。

但大模型时代,一切微小变革,或许将深切地改变一个时代潮流的流向。

而身处其中,我们往往后知后觉,但维度拉长,翻开这一页,就会发现,这一点点的微光,正是一个时代中,我们努力改变未来所留下的清晰注脚——大模型的 iOS 时刻里,不只有聚光灯下的 OpenAI 与百度们,更有成千上万的应用开发者。

*头图来源:百度

0 阅读:4