大模型时代,我们究竟需要什么样的AI应用?

科技偲睿洞察 2024-07-06 12:14:49

(图源:网络)

文/经纬‍‍‍‍‍

编辑/308

大模型时代,AI 到底该以什么样的方式走向商业落地并发挥价值?

这是当前人工智能领域依旧在激烈争论的话题,而且没有定论。值得注意的是,在 2023 年众多大模型纷纷出现的大背景下,一些观点认为:在大模型引发的新一轮 AI 浪潮下,行业可能也会像当年的移动互联网时代那样,出现 DAU 10 亿级别的「超级应用」。

不过,从眼前的情况来看,这种观点听起来尽管愿景美好,却未必切合实际。

毕竟,无论是在技术逻辑的构建层面,还是在商业价值的实现层面,AI 时代与移动互联网时代本质上都存在着完全不同的逻辑,这就意味着,从商业落地的角度考量,在 AI 时代寻找超级应用本身,就是脱离当前行业自身逻辑的无效做法。

正如百度创始人兼 CEO 李彦宏在 2024 世界人工智能大会上所言:要避免掉入「超级应用的陷阱」。

PART-01移动互联网时代的「超级应用」逻辑,行不通了

上世纪 80 年代,以色列经济学家奥兹·夏伊在《网络产业经济学》中首先提出了一个名为「网络效应」的概念,即网络效应,就是某种产品对一名用户的价值,取决于使用这个产品的其他用户的数量。随着用户数量增多,所有用户都会因用户规模扩大而收益,进而吸引更多用户,形成正反馈。

这就是所谓的 「用户越多,用户就会越多」。

夏伊的理论,在互联网时代就大行其道,尤其在移动互联网时代,更是被无数企业家奉为圭臬。对流量的争抢,也成为了移动互联网时代各大厂乐此不疲的日常,而 DAU 10 亿级别的「超级应用」,更是移动互联网时代创业走向成功的神话。

然而这套理论,在 AI 时代还会奏效吗?

很遗憾,答案是:并不会。

今年 3 月 10 日,与 OpenAI 同属一个阵营的微软,推出了 Copilot GPT 定制功能,旨在允许 Copilot Pro 用户根据自己的需求创建满足特定需求的 AI 助手。根据微软公布的数据,Copilot 付费用户最高曾达 4 亿。

然而好景不长,就在三个月后的 6 月 11 日,微软就公开宣布,从 7 月 10 号起将停止创建 GPTs,将删除所有 GPTs 的数据。

对此,微软表示他们正在继续评估针对消费者 Copilot 的可扩展策略,并优先考虑核心产品体验,同时仍然致力于为开发者提供机会。微软还强调,将把 GPT 的重心转移到商业和企业应用场景,并停止消费级 Copilot 方面的 GPT 工作。

微软的此番动作,其实已经在对外说明:大模型本身的能力,很难像当年的移动 App,直接面向 C 端消费者开展业务,也注定很难走向规模庞大的广大消费者群体。

无独有偶,OpenAI 在 2023 年底推出了 GPT Store 之后,这个项目如今也是前途未知,结果 OpenAI 选择与苹果进行 To B 的合作。由此可见,即使 GPT 这样的大模型,要想真正体现出面向消费者的价值,也需要通过类似于苹果这样的世界级终端巨头来进行 To C 的业务赋能。

其实,关于这一点,业内早就有人洞见到这一点。

(图源:百度)

比如说,百度创始人兼 CEO 李彦宏就表示:「大模型对于 To B 业务的改造,我认为会非常深刻和彻底的,我觉得比互联网对于 To B 的影响要大很多,要大一个数量级。所以我觉得随着时间的推移,在 B 端的影响会越来越体现出来,今天我觉得大模型在 B 端的影响,也已经大于 C 端了,所谓的 AI 原生应用,DAU 都不是很大,跟移动互联网时代没有办法比的,反而在 B 端看到太多的例子,在业务上产生很大的增益。」

所以,在 AI 时代,尤其是大模型时代,与其追求亿级的 DAU,可能不如沉下心来服务商业和企业市场。用移动互联网时代的「剑」,「斩」 AI 时代的「官」,无疑是行不通的。

那么,奥卡姆剃刀再次挥动,大模型应用的评价标准也应该回归了最基本的标准,也就是:「好用」。

PART-02闭源「固本」,才能效率高

可以确定的是,AI 应用的基础——大模型的性能将直接决定整个应用的硬上限。

自去年 8 月 23 日百度官宣文心一言之后,根据国家网信办公布数据,截至 2024 年 3 月,国内共有 117 个 GenAI 完成了备案。「百模大战」这个词汇,也从调侃变成现实。

百舸争流的局面,虽然带来了激烈的竞争,客观上也促使着大模型走进各行各业。在面临各业态具体场景时,大模型领域「开源」与「闭源」的路线之争,似乎有了答案。

需要注意的是,当前大模型的开源与以往的软件开源是不一样的,通常并没有开放源代码,仅仅给了用户「投喂」数据,训练 AI、定制 AI 等方面的权限。由于训练数据是往往由用户上传,模型的最终训练结果也很难预料。市面上甚至出现了专门「毒害」AI 的手段。

(通过“毒害”AI,生成错误的图片,来源:ArtNews)

所以,基于开源模型做微调、部署、以及二次开发往往面临后期调整,带来不必要的人力成本较高。在算力昂贵,企业对于大模型性价比敏感,对快速见到效果的需求强烈,以及不缺竞品的当下,开源大模型在商业化上有着先天的劣势。

而闭源大模型则正相反。

闭源大模型通常由大型企业开发并提供商业支持,包括技术支持、定制化服务和维护。与开源大模型小规模地去做验证,闭源大模型的开发企业也通常有实力用更大算力验证自家模型。同时,闭源大模型的开发团队也常对模型进行专门的优化,提供更高的性能和效率,甚至可以提供开源模型无法实现的功能和性能,如某些特定领域的深度学习优化技术、特定硬件加速等。

更重要的是,闭源模型供应商通常会确保其产品符合各类法律法规和行业标准,例如 GDPR、HIPAA 等。这对于需要遵守严格合规要求的行业,如金融、医疗和政府部门尤为重要。

所以,对稳定性、高性能、专业支持以及合规性有着更高要求的企业级 AI 商业应用,与闭源大模型天生「八字相合」。

正是因为如此,百度 CEO 李彦宏也公开表示:「今天不管是在中国也好、在美国也好,最强的基础模型都是闭源的,而各种各样的小模型、最好的小模型,都是通过大模型蒸馏来的。通过大模型降维做出来的模型就是更好的,这样也会导致闭源在成本上、在效率上也会有优势。」

实际上, 大模型在现阶段的商业化应用,也的确印证了这个判断。

一个典型的案例是:快递物流信息聚合平台快递 100 在接入文心大模型后,用户可以「一张图、一句话寄快递」,寄快递的平均时间从 3 分 40 秒缩短到 19 秒。售后方面,快递 100 的 90% 客服问题都是由大模型独立解决,一次性问题解决率达到了 99.4%,大大提升了服务效率。

「我们让这个模型小型化,直接让业务去用的不是最大的、最 Powerful 的模型,而是根据那个模型去裁剪,去蒸馏,去调优,朝某个方向优化,做出来响应速度变快了,调用成本更低了」,百度 CEO 李彦宏说,「我们发现根据最领先的大模型裁剪出来的小模型,比外界这些开源模型,如果说同等成本的模型的话,效果更好;如果同等效果的话,它的成本更低,响应速度也会更快。」

所以,在商业落地的维度上来看,大模型闭源的本质,其实更多的是「固本培元」,而AI 应用只有修好大模型的「内功」,才有可能达到「好用」的境界。

PART-03智能体,可能是大模型应用的未来

但修炼大模型的企业又何其之多。

在过去的一年多时间里,整个 AI 行业处在非常热闹的「卷模型」浪潮中,一度出现了「百模大战」的盛况。但实际上,百鸟争鸣的背后,是各体系技术能力、算力、财力等综合实力的比拼。如同本世纪初,移动互联网方兴未艾,手机操作系统也曾迎来一波「白刃战」,Windows Mobile、Palm、塞班、Bada,你方唱罢我登场,但笑到最后的只有iOS 和安卓。

但从目前的情况来看,大模型行业的「内卷」,由于对算力、硬件等的迫切需求,已经带来了如社会资源浪费等诸多问题;而且坦率地说,这一波科技浪潮,对于多数初创企业,烧钱的意义不大。

毕竟,只有大模型是远远不够的。大模型本身不产生价值,就如同没有任何App 的手机一样,大模型则需要通过构建 AI原生应用才能走向公众。

正如百度 CEO 李彦宏所言,应用才是模型的真正价值所在。「再强大的基础模型能力,让普罗大众真正接触到、感受到、用上、用得好才是硬道理」,他说:「我们需要的,是 100 万量级的AI原生应用,但是不需要 100 个大模型」。

可喜的是,自去年下半年以来,过去一段时间,大家逐步「回过味来」,对应用的重视程度逐步上升。用户从关注哪些模型最强,到关注哪些模型能够在自己的场景里用起来,以及真正能够带来什么样的实际价值。

就在文心大模型发布前三个月,2023年 5 月,李彦宏宣称,百度要做第一个把全部产品重做一遍的公司,「不是整合,不是接入,是重做,重构」——实现这个目标需要的就是基于大模型的「卷」应用。

令人关注的是,在 2023 中国国际煤炭展上,百度发布了其与山源电子基于文心大模型共同打造了矿山行业智能应用「电博士及数字调度员」。通过提供矿山供电专业相关知识经验,训练大模型具备煤矿供电的专业知识和技能,「电博士」可以实现陪伴式煤矿供电辅助运维。

即使像煤矿供电这样的传统业态,也可以备大模型赋能,大模型应用的开发无疑有充足的想象空间。

对于大模型落地的未来,李彦宏表示:「我们即将进入一个AI原生的时代,进入一个人机通过 prompt 来交互的时代。大模型将开启一个繁荣的 AI原生应用生态。大量AI原生应用将不断涌现,数字技术与实体经济将深度融合。」

然而这个奇点现在还没有来到。业内,无论是初创公司、还是互联网大厂,都在努力摸索产品市场契合度,致力于探索最能发挥生成式 AI 能力、能被数十亿人使用的超级应用形态。

(图源:百度)

但超级应用最可能的形态是什么?

在我们看来,智能体,可能是一个有前景的方向。

从概念上来说,智能体是指能够自主感知环境、做出决策并执行行动的系统。智能体可以在没有人类干预的情况下自主决策和行动,能够与其他智能体或人类进行交流和合作,可以对外部刺激做出及时的反应,并够根据已有经验主动调整自身的行为。

而从技术维度来看,智能体集合了机器学习、深度学习、自然语言处理等多领域技术,是人工智能技术的「集大成者」和完全体形态。

也因此,智能体或可成为大模型落地最有前景的发展方向,也被认为是最接近AGI 的方向。

有意思的是,今年 6 月 28 日,中国工程院朱有勇院士及团队与百度共同打造的首个农业智能体——「农民院士智能体」正式发布。农民院士智能体基于文心大模型,通过学习朱有勇院士研究成果以及相关的农业知识,可以以对话的方式模拟朱有勇院士对包括旱地稻种植条件、培育技术、病虫害防治等农业生产中遇到的实际问题进行详细解答。

当然,制作一个好的智能体也并非难事,只需自然语言把智能体的工作流说清楚,再配上专有的知识库即可。

如果展望未来,在医疗、金融、教育、制造、交通、农业等领域,依据对应的场景、经验、规则、数据等,很有可能产生多样的智能体。而当数以百万量级的智能体将出现,势必会形成庞大的智能体生态——最终,复杂的任务可以由多个智能体交互协作完成,并不断地学习与进化,达到像人一样的思考。

所以,从这个角度来看,大模型时代,AI 通过商业落地实现其价值的逻辑,已经相当明晰,那就是:在 AI 的落地思路上,大模型是根,应用层则开枝散叶;只有「固本培元」,而且「融会贯通」才能「中慧外秀」:兼顾了基础层大模型的「强」,与应用层的「能干」,一个 AI 应用才能真正做到「好用」,也更能发挥出价值。

正如百度创始人兼 CEO 李彦宏在 2024 世界人工智能大会上所言:

我们要避免掉入「超级应用陷阱」,觉得一定要出现一个 DAU 10 亿的 APP 才叫成功,这是移动时代的思维逻辑。其实不一定,AI 时代,「超级能干」的应用比只看 DAU 的「超级应用」恐怕要更重要,只要对产业、对应用场景能产生大的增益,整体的价值就比移动互联网要大多了。

0 阅读:0

科技偲睿洞察

简介:感谢大家的关注