国内AI大逃杀开启,这次字节能笑到最后吗?

运营人的五六事 2024-05-31 21:44:54

作者 | 丰之余

编辑 | 陈维贤

设计 | 蝶哥

最近,字节推出的大模型「豆包」杀疯了!

在对手林立的情况下,上线短短几个月,就后发先至超过一众国产大模型,成为唯一一个 MAU 超过 2000W 大关的国产大模型 APP。

在应用商店热度排行上,「豆包」也是一骑绝尘——在 App Store 效率榜上长期霸榜,在免费总榜也是唯一一个 AI 类 APP。

不止 C端 市场,「豆包」在 B端 市场也重拳出击。

在前阵子举办的「火山引擎原动力大会」上,字节公布了击穿地板的底价标准。一句话总结就是:比行业价格低 99.3%。

作为国内最炙手可热的互联网大厂,其实字节入场 AI 不算早,但一出手就不同凡响,可以说是直接按下了“国内 AI 大逃杀”的开启按钮。

发布会结束的两周来,国内平台级的大模型不是跟进降价,就是在准备降价的路上。

这是“真把大模型的价格打下来”了!很多网友们都戏称这是「一个“豆包”引发的“血战”」。

那么,火出圈的「豆包」能力如何?使用体验到底怎么样?「豆包」和字节能笑到最后吗?

今天我们就来深度测评一下。

01新晋AI顶流,「豆包」凭啥这样火

经过 2 周多的深入测评,我不由得感叹:字节做 APP 产品,确实有一套。

尽管市场上已有大量同类型的AI应用,但字节跳动总能找到独特的切入点。这种差异化给「豆包」带来了独树一帜的竞争力,迅速吸引了大量用户。

1)目前最佳的“交互体验”

作为一名互联网媒体编辑,我使用过的大模型 APP 很多,但「豆包」是我体验下来“交互体验”最佳的一个。

为什么这么说?

首先,从第一眼开始「豆包」就给我们鲜明的“智能助理”体感。

大家都在说 AGI 信仰、愿景,那么 AGI 最重要的特点是什么?

我认为,它首先得是一个让我愿意对话的“智能人”,而不是一个功能齐全的“工具合集”。对吧?

我们下载「豆包」,它有一个拟人的「IP 形象」,有一个像人的「花名」;

打开「豆包」,界面像是在微信聊天,默认提问方式是语音,默认回答方式也是「语音+转文字」;

顶部有图标可以打电话,像真人对话一样你一句我一句;

……

如果都 AI 时代了,我还需要采用在“手机键盘上费力打字”的方式做交互,这也太不 AI 了!

仅从「豆包」的 IP 形象,以及默认语音交互方式,就能看出字节在 AI 应用上的产品思考——从基因根子上就要采用 AI 的方式。

2)大模型能力出色

当然,作为一款通用 AI 应用,最关键的还是它解决问题的能力,到底能不能帮助我们提高效率、辅助完成工作。

① “进阶版”搜索引擎

在知识储备方面,「豆包」不仅上知天文下晓地理,还能随时随地获取全网资讯热点,你甚至可以把它当一个“进阶版”搜索引擎使用。

为什么是进阶版?

传统搜索引擎大家都非常熟悉,我们在搜索引擎里输入自己的问题,搜索引擎根据关键词从各处抓取链接,然后排序展示给你。如果没搜到,你还得绞尽脑汁重新优化自己的提问。

更讨厌的是,你根本不知道摆在你面前的是不是广告?是不是钓鱼贴?

在传统搜索方式里,只是找到客观、准确的非广告信息就能耗费你大量精力了。

那么在「豆包」里搜索,体验怎么样呢?

比如 618 快到了,我让「豆包」给我介绍一下各大电商平台都有什么玩法和政策?

输入问题后,它的回答速度非常快,先简练地将不同平台的政策、玩法分别用1句话总结,让我能够快速掌握不同平台的整体情况。

接着,他又非常贴心的将平台的具体玩法变化结构化呈现出来,时间、玩法、方式、特点条理清楚,扫一眼就能快速掌握信息,全程不超过 30 秒。

可上下滚动查看更多

「豆包」里搜索不仅获取信息全面高效,更重要的是信息还可靠可溯源,且自动排除各种广告和钓鱼贴的干扰。每一条所搜总结,它都会列出参考资料,如想了解更多,随时可以针对任何延伸问题进行追问。

如下图,当我追问“超级红包”具体的玩法后,「豆包」迅速给出答案——如何领取、如何分享、如何核销、会场玩法、其他玩法……全流程一个不落。

可上下滚动查看更多

再比如我问「豆包」一个相对开放的问题:最近亚当很火,发生什么了?

「豆包」的回答没有任何“车轱辘话”,简单直接的告诉我“因为他参加了《歌手 2024》”。在答案后,豆包还进一步介绍了下亚当的背景、风格等。

除此之外,我又对周鸿祎卖迈巴赫、庆余年 2 播出、菏泽树哥郭有才等多个热点事件进行了多轮测试,竟没有找出一处“大模型幻觉”问题。

可以说,「豆包」在语义理解、全网信息实时检索、信息筛选、文本输出能力已经非常靠谱了。

注:大模型幻觉是指:大语言模型在回答某些问题时,产生不准确、不完整甚至是虚假的误导性的输出。

② 工作、学习的提效利器

作为通用 AI 工具,「豆包」在解决具体场景下的工作、学习问题的能力,也是非常强悍的。

比如我想了解中级经济师的报考,但我毫无经验,网上的信息又良莠不齐,此时将问题告诉「豆包」,它就非常精准的帮我总结了正确的报考资质、要求,甚至报名流程都给我准备好了。

不仅如此,从真题获取方式、到合理的备考时间安排,都给你安排的明明白白。

可上下滚动查看更多

甚至,你在智能体广场里,还能搜到专门的“中级经济师备考助手”“刷题助手”“考试督导老师”……该说不说,这都快赶上“私教”待遇了!

作为一名编辑,阅读各类行业报告是刚需,但有些报告又长有难度,不仅语言晦涩还专业名词巨多。

为了考验下「豆包」,我把刚到手的一篇近 90 页的超长报告《AI 行业大模型调研报告》发给「豆包」。

结果,「豆包」就像一位资深的行研编辑,将报告的框架、观点、要点、结论等结构化呈现出来,且内容非常详尽。

看完这段总结,你真的对这本报告的整体内容有的进一步了解,而不是很多“AI 工具”常出现的“读完仿佛什么也没读”的窘境。如下图,内容有点长,大家不妨看看完整的总结,真的很奈斯!

可上下滚动查看更多

更友好的是,你不仅可以针对报告的任何内容进行追问,报告之外的“发散问题”它也能很好的回答。

比如我先问“报告里 Agent 相关的内容”,接着追问“有无报告之外的,我需要了解的”,让「豆包」给我推荐相关书籍等等,都能非常顺畅地得到解答。

可上下滚动查看更多

事实上,不止是 PDF,Word、Excel 等各种常见文档都能直接上传。

想象一下,你在一个项目里收到了一大堆资料文件,领导第二天要做会议分享,你要在下班前完成会议 PPT。这时,如果你有一个高效工具帮你做信息整理,你的工作进度将会飞起。

这时候,更刺激的来了。你甚至还能更进一步,直接让「豆包」根据文档报告,给你生成一份 PPT 大纲!

从结果来看,它的逻辑还是相当顺畅的,核心结构完整,并且具体到每一页该讲什么内容,都能清晰罗列出来。

省下分析归纳的步骤后,我们可以将更多精力放在更重要的内容方面,只需顺着它的脉络填充,再套个好看的模版,一份新鲜的 PPT 就做好了。

可上下滚动查看更多

身为一名内容工作者,每篇新选题都需要深入了解一个行业、一个产业。有了「豆包」助力,效率提升不是一星半点。

比如我们想从专业的营销角度,来分析下新能源汽车。我可以直接让它生成一个行业报告。——“请你利用麦肯锡波特五力模型来分析一下新能源汽车行业,要足够专业,内容翔实,结构清晰”。

不到 10 秒钟,一个基于波特五力模型的行业框架就出来了。省去了大量收集素材、整合素材的时间,而且在实际体验中我发现,对「豆包」问得越细,它回答得就越专业、越具体,很多时候还能给我新的灵感和观点启发。

可以上下滚动查看更多

至于写个朋友圈、小红书文案、周报、讲稿、任务采访大纲等都毫无压力,甚至简单的视频脚本都能妥妥胜任。

可以说拯救广大“新媒体人”于水火的利器了。

③ 生活中的“随身哆啦a梦”

至于生活类的场景,经测试我们几乎可以说:遇到什么不懂的事,只要问「豆包」,都能解决的七七八八。

比如周末在家买了皮皮虾,问问「豆包」:有什么好的做法?怎么剥皮?

「豆包」不仅回答了皮皮虾的做法、剥皮方法,还在底部配上对应的操作视频。

保姆级贴心体验!

大学同学要来上海玩,问我有什么推荐景点、美食的。身为死宅,几乎两眼一抹黑。

这时,把具体情况告诉「豆包」,立刻一份旅游攻略就被安排得明明白白。

不仅 Day1、Day2、Day3 景点排好,甚至旅游的动线都清楚地给你列出来……这可比自己做的攻略详细的多了!

可上下滚动查看更多

3)丰富度+可拓展性

千万级用户量除了带来了热度,也带来了充足的智能体社区建设者,「豆包」智能体社区的丰富度、可拓展性都是国内大模型里顶级的。

在「豆包」APP 上,你可以像游戏里“捏角色”一样,通过「添加形象」「设定声音」「设定性格」等维度“捏一个自己的智能体”。

你甚至可以克隆自己的声音,订一个专属自己的智能体声音。操作也很简单,按照提示清晰的读一段话,就完成了。

我按照步骤,用自己声音捏了一个“讲冷笑话的小卡”。

但你别说,这克隆的效果还真不错。语音通话打过去,声音的音色稳定,对话流畅,尤其是听他“用我的声音给我讲冷笑话”,真的是格外有趣哈哈!

比如在「火山引擎原动力大会」上,就展示了一个小女孩自己制作了“学习小助手”智能体。

你只需要给问题拍一张照片,“学习小助手”就会针对你的学习问题给出解答。

据《火山引擎原动力大会》里的数据介绍,「豆包」的智能体总量已经达到 800W 个了,这个数字甚至超过了大部分大模型的 MAU(月活)了。

有趣、有用的 C端 玩法,来自海量尝试后的“涌现”。在绝对数量面前,「豆包」的智能体社区想不好玩都不行。

02国产AI大逃杀,字节豆包能笑到最后吗?

从前面的测评中我们可以看到,AI 大模型的能力已经很强大了。

但我们都知道,这不是终点,甚至只是起步。

因为 AGI 底层技术还在快速迭代,AI 应用的竞争力并不只是建立在现在大模型能做什么,更建立在几个月后、几年后大模型能做到什么,以及企业在技术持续演进下优化、迭代产品的能力。

所以当我们试图对这场“国产 AI 大逃杀”做些预测和分析时,我们需要回到大模型更底层的能力维度上。

我将其总结为 AI 大模型的三根支柱:算力、数据、产品落地能力。

1)算力

某种意义上,AGI 本质是:电+芯片=产出智能。算力就是 AI 时代的石油,就是大模型企业的核心竞争力。

而国内,拥有最丰富算力资源的企业就是——字节跳动。

据之前《晚点 LatePost》报道,字节2023年向英伟达订购了超过 10 亿美元的 GPU(约合 70 亿元人民币),到货和没到货的 A100 与 H800 总计有 10 万块。而 2022 年全年,英伟达数据中心 GPU 在中国的销售总额大约为 100 亿元,也就是说,仅字节一家公司2023年的订单可能已接近英伟达去年在中国销售的商用 GPU 总和。

事实上早在推出豆包之前,字节就已经成为了国内最大的 AI 算力供给方,包括智谱、百川、MiniMax、出门问问等众多热门大模型,用的都是字节端算力。

2023 年字节公布「火山方舟」首批大模型合作伙伴

2)数据

在 2023 年,“大模型幻觉”经常被提及。

所谓“幻觉”指的就是,AI 生成的内容不准确、无意义,甚至瞎编乱造。

这就是典型的数据问题。因为大模型的核心原理,就是通过预测“下一个字符”概率来输出内容。

那么此时,关键是什么?

数据的质量、数据的数量、数据标注的准确的、多样性……

在「豆包」被推出之前,字节就拥有中国最大的内容池,其算法、数据的精细化程度都是最顶级的;在「豆包」被推出之后,字节又成为最多活跃用户使用的 AI 软件……

在数据维度层面,恐怕国内互联网大厂都无出其右。

3)产品落地能力

关于字节的产品能力,其实不必过多赘述。细节处见产品力,而这在「豆包」产品交互体验部分已经有了充分的展示和印证。

并且,「豆包」一个孤立的应用,背后是字节新成立的一整个 AI 部门——Flow。

据国内媒体采访显示,除了 AI 原生应用外,抖音、头条、飞书部分功能都使用了大模型,比如抖音搜索、头条搜索结果就是用豆包大模型来生成。

看到这里我们会发现,豆包的竞争力其实并不偶然,而是字节在各方综合能力、优势的自然展现。

03结语

当然,在现阶段国内大模型还在“做大蛋糕”的阶段。

大模型市场才刚刚开始,重要的是一起把大模型做好、把应用落地做好、把成本做低,让更多人和企业受益。

在我看来,「豆包」的出现正是国内 AI 应用告诉发展的提现。

未来,希望「豆包」越做越好用,也希望字节能做出越来越多像「豆包」这样,精良、流量、有产品思考的 AI 产品。

更多运营干货

「品牌对话」 | 诺特兰德 | 鸭鸭 | NOWWA 挪瓦咖啡 | 霸王茶姬 | 立白 | 全棉时代 | 花加 | 熊猫不走 | 唐久便利店 | 笑果文化 | 天虹 | 萨福 | 樊登读书 | 首尔丽格 | 水獭吨吨 | 全聚德 | Lemonbox | 蕉下 | 巡物社

「品牌观察」 | pidan | 名创优品 | 锅圈食汇 | 貂艺 | 库迪咖啡 | tea'stone | 达美乐 | 书亦烧仙草 | 蔚来 | 海底捞 | 茶颜悦色 | 瑞幸 | 亚朵酒店

「平台运营」微信 | 视频号 | 企业微信 | 抖音 | 快手 | 小红书 | 淘宝 | 支付宝 | B站 | 拼多多

「运营方法论」产品营销 | 内容方法论 | 投放营销 | 用户运营 | 店铺经营 | 直播电商 | 私域运营 | 出海运营 | AIGC

0 阅读:0

运营人的五六事

简介:感谢大家的关注