国内AI大逃杀开启，这次字节能笑到最后吗？

作者 | 丰之余

编辑 | 陈维贤

设计 | 蝶哥

最近，字节推出的大模型「豆包」杀疯了！

在对手林立的情况下，上线短短几个月，就后发先至超过一众国产大模型，成为唯一一个 MAU 超过 2000W 大关的国产大模型 APP。

在应用商店热度排行上，「豆包」也是一骑绝尘——在 App Store 效率榜上长期霸榜，在免费总榜也是唯一一个 AI 类 APP。

不止 C端市场，「豆包」在 B端市场也重拳出击。

在前阵子举办的「火山引擎原动力大会」上，字节公布了击穿地板的底价标准。一句话总结就是：比行业价格低 99.3%。

作为国内最炙手可热的互联网大厂，其实字节入场 AI 不算早，但一出手就不同凡响，可以说是直接按下了“国内 AI 大逃杀”的开启按钮。

发布会结束的两周来，国内平台级的大模型不是跟进降价，就是在准备降价的路上。

这是“真把大模型的价格打下来”了！很多网友们都戏称这是「一个“豆包”引发的“血战”」。

那么，火出圈的「豆包」能力如何？使用体验到底怎么样？「豆包」和字节能笑到最后吗？

今天我们就来深度测评一下。

01新晋AI顶流，「豆包」凭啥这样火

经过 2 周多的深入测评，我不由得感叹：字节做 APP 产品，确实有一套。

尽管市场上已有大量同类型的AI应用，但字节跳动总能找到独特的切入点。这种差异化给「豆包」带来了独树一帜的竞争力，迅速吸引了大量用户。

1）目前最佳的“交互体验”

作为一名互联网媒体编辑，我使用过的大模型 APP 很多，但「豆包」是我体验下来“交互体验”最佳的一个。

为什么这么说？

首先，从第一眼开始「豆包」就给我们鲜明的“智能助理”体感。

大家都在说 AGI 信仰、愿景，那么 AGI 最重要的特点是什么？

我认为，它首先得是一个让我愿意对话的“智能人”，而不是一个功能齐全的“工具合集”。对吧？

我们下载「豆包」，它有一个拟人的「IP 形象」，有一个像人的「花名」；

打开「豆包」，界面像是在微信聊天，默认提问方式是语音，默认回答方式也是「语音+转文字」；

顶部有图标可以打电话，像真人对话一样你一句我一句；

……

如果都 AI 时代了，我还需要采用在“手机键盘上费力打字”的方式做交互，这也太不 AI 了！

仅从「豆包」的 IP 形象，以及默认语音交互方式，就能看出字节在 AI 应用上的产品思考——从基因根子上就要采用 AI 的方式。

2）大模型能力出色

当然，作为一款通用 AI 应用，最关键的还是它解决问题的能力，到底能不能帮助我们提高效率、辅助完成工作。

① “进阶版”搜索引擎

在知识储备方面，「豆包」不仅上知天文下晓地理，还能随时随地获取全网资讯热点，你甚至可以把它当一个“进阶版”搜索引擎使用。

为什么是进阶版？

传统搜索引擎大家都非常熟悉，我们在搜索引擎里输入自己的问题，搜索引擎根据关键词从各处抓取链接，然后排序展示给你。如果没搜到，你还得绞尽脑汁重新优化自己的提问。

更讨厌的是，你根本不知道摆在你面前的是不是广告？是不是钓鱼贴？

在传统搜索方式里，只是找到客观、准确的非广告信息就能耗费你大量精力了。

那么在「豆包」里搜索，体验怎么样呢？

比如 618 快到了，我让「豆包」给我介绍一下各大电商平台都有什么玩法和政策？

输入问题后，它的回答速度非常快，先简练地将不同平台的政策、玩法分别用1句话总结，让我能够快速掌握不同平台的整体情况。

接着，他又非常贴心的将平台的具体玩法变化结构化呈现出来，时间、玩法、方式、特点条理清楚，扫一眼就能快速掌握信息，全程不超过 30 秒。

可上下滚动查看更多

「豆包」里搜索不仅获取信息全面高效，更重要的是信息还可靠可溯源，且自动排除各种广告和钓鱼贴的干扰。每一条所搜总结，它都会列出参考资料，如想了解更多，随时可以针对任何延伸问题进行追问。

如下图，当我追问“超级红包”具体的玩法后，「豆包」迅速给出答案——如何领取、如何分享、如何核销、会场玩法、其他玩法……全流程一个不落。

可上下滚动查看更多

再比如我问「豆包」一个相对开放的问题：最近亚当很火，发生什么了？

「豆包」的回答没有任何“车轱辘话”，简单直接的告诉我“因为他参加了《歌手 2024》”。在答案后，豆包还进一步介绍了下亚当的背景、风格等。

除此之外，我又对周鸿祎卖迈巴赫、庆余年 2 播出、菏泽树哥郭有才等多个热点事件进行了多轮测试，竟没有找出一处“大模型幻觉”问题。

可以说，「豆包」在语义理解、全网信息实时检索、信息筛选、文本输出能力已经非常靠谱了。

注：大模型幻觉是指：大语言模型在回答某些问题时，产生不准确、不完整甚至是虚假的误导性的输出。

② 工作、学习的提效利器

作为通用 AI 工具，「豆包」在解决具体场景下的工作、学习问题的能力，也是非常强悍的。

比如我想了解中级经济师的报考，但我毫无经验，网上的信息又良莠不齐，此时将问题告诉「豆包」，它就非常精准的帮我总结了正确的报考资质、要求，甚至报名流程都给我准备好了。

不仅如此，从真题获取方式、到合理的备考时间安排，都给你安排的明明白白。

可上下滚动查看更多

甚至，你在智能体广场里，还能搜到专门的“中级经济师备考助手”“刷题助手”“考试督导老师”……该说不说，这都快赶上“私教”待遇了！

作为一名编辑，阅读各类行业报告是刚需，但有些报告又长有难度，不仅语言晦涩还专业名词巨多。

为了考验下「豆包」，我把刚到手的一篇近 90 页的超长报告《AI 行业大模型调研报告》发给「豆包」。

结果，「豆包」就像一位资深的行研编辑，将报告的框架、观点、要点、结论等结构化呈现出来，且内容非常详尽。

看完这段总结，你真的对这本报告的整体内容有的进一步了解，而不是很多“AI 工具”常出现的“读完仿佛什么也没读”的窘境。如下图，内容有点长，大家不妨看看完整的总结，真的很奈斯！

可上下滚动查看更多

更友好的是，你不仅可以针对报告的任何内容进行追问，报告之外的“发散问题”它也能很好的回答。

比如我先问“报告里 Agent 相关的内容”，接着追问“有无报告之外的，我需要了解的”，让「豆包」给我推荐相关书籍等等，都能非常顺畅地得到解答。

可上下滚动查看更多

事实上，不止是 PDF，Word、Excel 等各种常见文档都能直接上传。

想象一下，你在一个项目里收到了一大堆资料文件，领导第二天要做会议分享，你要在下班前完成会议 PPT。这时，如果你有一个高效工具帮你做信息整理，你的工作进度将会飞起。

这时候，更刺激的来了。你甚至还能更进一步，直接让「豆包」根据文档报告，给你生成一份 PPT 大纲！

从结果来看，它的逻辑还是相当顺畅的，核心结构完整，并且具体到每一页该讲什么内容，都能清晰罗列出来。

省下分析归纳的步骤后，我们可以将更多精力放在更重要的内容方面，只需顺着它的脉络填充，再套个好看的模版，一份新鲜的 PPT 就做好了。

可上下滚动查看更多

身为一名内容工作者，每篇新选题都需要深入了解一个行业、一个产业。有了「豆包」助力，效率提升不是一星半点。

比如我们想从专业的营销角度，来分析下新能源汽车。我可以直接让它生成一个行业报告。——“请你利用麦肯锡波特五力模型来分析一下新能源汽车行业，要足够专业，内容翔实，结构清晰”。

不到 10 秒钟，一个基于波特五力模型的行业框架就出来了。省去了大量收集素材、整合素材的时间，而且在实际体验中我发现，对「豆包」问得越细，它回答得就越专业、越具体，很多时候还能给我新的灵感和观点启发。

可以上下滚动查看更多

至于写个朋友圈、小红书文案、周报、讲稿、任务采访大纲等都毫无压力，甚至简单的视频脚本都能妥妥胜任。

可以说拯救广大“新媒体人”于水火的利器了。

③ 生活中的“随身哆啦a梦”

至于生活类的场景，经测试我们几乎可以说：遇到什么不懂的事，只要问「豆包」，都能解决的七七八八。

比如周末在家买了皮皮虾，问问「豆包」：有什么好的做法？怎么剥皮？

「豆包」不仅回答了皮皮虾的做法、剥皮方法，还在底部配上对应的操作视频。

保姆级贴心体验！

大学同学要来上海玩，问我有什么推荐景点、美食的。身为死宅，几乎两眼一抹黑。

这时，把具体情况告诉「豆包」，立刻一份旅游攻略就被安排得明明白白。

不仅 Day1、Day2、Day3 景点排好，甚至旅游的动线都清楚地给你列出来……这可比自己做的攻略详细的多了！

可上下滚动查看更多

3）丰富度+可拓展性

千万级用户量除了带来了热度，也带来了充足的智能体社区建设者，「豆包」智能体社区的丰富度、可拓展性都是国内大模型里顶级的。

在「豆包」APP 上，你可以像游戏里“捏角色”一样，通过「添加形象」「设定声音」「设定性格」等维度“捏一个自己的智能体”。

你甚至可以克隆自己的声音，订一个专属自己的智能体声音。操作也很简单，按照提示清晰的读一段话，就完成了。

我按照步骤，用自己声音捏了一个“讲冷笑话的小卡”。

但你别说，这克隆的效果还真不错。语音通话打过去，声音的音色稳定，对话流畅，尤其是听他“用我的声音给我讲冷笑话”，真的是格外有趣哈哈！

比如在「火山引擎原动力大会」上，就展示了一个小女孩自己制作了“学习小助手”智能体。

你只需要给问题拍一张照片，“学习小助手”就会针对你的学习问题给出解答。

据《火山引擎原动力大会》里的数据介绍，「豆包」的智能体总量已经达到 800W 个了，这个数字甚至超过了大部分大模型的 MAU（月活）了。

有趣、有用的 C端玩法，来自海量尝试后的“涌现”。在绝对数量面前，「豆包」的智能体社区想不好玩都不行。

02国产AI大逃杀，字节豆包能笑到最后吗？

从前面的测评中我们可以看到，AI 大模型的能力已经很强大了。

但我们都知道，这不是终点，甚至只是起步。

因为 AGI 底层技术还在快速迭代，AI 应用的竞争力并不只是建立在现在大模型能做什么，更建立在几个月后、几年后大模型能做到什么，以及企业在技术持续演进下优化、迭代产品的能力。

所以当我们试图对这场“国产 AI 大逃杀”做些预测和分析时，我们需要回到大模型更底层的能力维度上。

我将其总结为 AI 大模型的三根支柱：算力、数据、产品落地能力。

1）算力

某种意义上，AGI 本质是：电+芯片=产出智能。算力就是 AI 时代的石油，就是大模型企业的核心竞争力。

而国内，拥有最丰富算力资源的企业就是——字节跳动。

据之前《晚点 LatePost》报道，字节2023年向英伟达订购了超过 10 亿美元的 GPU（约合 70 亿元人民币），到货和没到货的 A100 与 H800 总计有 10 万块。而 2022 年全年，英伟达数据中心 GPU 在中国的销售总额大约为 100 亿元，也就是说，仅字节一家公司2023年的订单可能已接近英伟达去年在中国销售的商用 GPU 总和。

事实上早在推出豆包之前，字节就已经成为了国内最大的 AI 算力供给方，包括智谱、百川、MiniMax、出门问问等众多热门大模型，用的都是字节端算力。

2023 年字节公布「火山方舟」首批大模型合作伙伴

2）数据

在 2023 年，“大模型幻觉”经常被提及。

所谓“幻觉”指的就是，AI 生成的内容不准确、无意义，甚至瞎编乱造。

这就是典型的数据问题。因为大模型的核心原理，就是通过预测“下一个字符”概率来输出内容。

那么此时，关键是什么？

数据的质量、数据的数量、数据标注的准确的、多样性……

在「豆包」被推出之前，字节就拥有中国最大的内容池，其算法、数据的精细化程度都是最顶级的；在「豆包」被推出之后，字节又成为最多活跃用户使用的 AI 软件……

在数据维度层面，恐怕国内互联网大厂都无出其右。

3）产品落地能力

关于字节的产品能力，其实不必过多赘述。细节处见产品力，而这在「豆包」产品交互体验部分已经有了充分的展示和印证。

并且，「豆包」一个孤立的应用，背后是字节新成立的一整个 AI 部门——Flow。

据国内媒体采访显示，除了 AI 原生应用外，抖音、头条、飞书部分功能都使用了大模型，比如抖音搜索、头条搜索结果就是用豆包大模型来生成。

看到这里我们会发现，豆包的竞争力其实并不偶然，而是字节在各方综合能力、优势的自然展现。

03结语

当然，在现阶段国内大模型还在“做大蛋糕”的阶段。

大模型市场才刚刚开始，重要的是一起把大模型做好、把应用落地做好、把成本做低，让更多人和企业受益。

在我看来，「豆包」的出现正是国内 AI 应用告诉发展的提现。

未来，希望「豆包」越做越好用，也希望字节能做出越来越多像「豆包」这样，精良、流量、有产品思考的 AI 产品。

更多运营干货

「平台运营」微信 | 视频号 | 企业微信 | 抖音 | 快手 | 小红书 | 淘宝 | 支付宝 | B站 | 拼多多

玩酷网

国内AI大逃杀开启，这次字节能笑到最后吗？

运营人的五六事