作者 | 丰之余
编辑 | 陈维贤
设计 | 蝶哥
最近,字节推出的大模型「豆包」杀疯了!
在对手林立的情况下,上线短短几个月,就后发先至超过一众国产大模型,成为唯一一个 MAU 超过 2000W 大关的国产大模型 APP。
在应用商店热度排行上,「豆包」也是一骑绝尘——在 App Store 效率榜上长期霸榜,在免费总榜也是唯一一个 AI 类 APP。
不止 C端 市场,「豆包」在 B端 市场也重拳出击。
在前阵子举办的「火山引擎原动力大会」上,字节公布了击穿地板的底价标准。一句话总结就是:比行业价格低 99.3%。
作为国内最炙手可热的互联网大厂,其实字节入场 AI 不算早,但一出手就不同凡响,可以说是直接按下了“国内 AI 大逃杀”的开启按钮。
发布会结束的两周来,国内平台级的大模型不是跟进降价,就是在准备降价的路上。
这是“真把大模型的价格打下来”了!很多网友们都戏称这是「一个“豆包”引发的“血战”」。
那么,火出圈的「豆包」能力如何?使用体验到底怎么样?「豆包」和字节能笑到最后吗?
今天我们就来深度测评一下。
01新晋AI顶流,「豆包」凭啥这样火经过 2 周多的深入测评,我不由得感叹:字节做 APP 产品,确实有一套。
尽管市场上已有大量同类型的AI应用,但字节跳动总能找到独特的切入点。这种差异化给「豆包」带来了独树一帜的竞争力,迅速吸引了大量用户。
1)目前最佳的“交互体验”作为一名互联网媒体编辑,我使用过的大模型 APP 很多,但「豆包」是我体验下来“交互体验”最佳的一个。
为什么这么说?
首先,从第一眼开始「豆包」就给我们鲜明的“智能助理”体感。
大家都在说 AGI 信仰、愿景,那么 AGI 最重要的特点是什么?
我认为,它首先得是一个让我愿意对话的“智能人”,而不是一个功能齐全的“工具合集”。对吧?
我们下载「豆包」,它有一个拟人的「IP 形象」,有一个像人的「花名」;
打开「豆包」,界面像是在微信聊天,默认提问方式是语音,默认回答方式也是「语音+转文字」;
顶部有图标可以打电话,像真人对话一样你一句我一句;
……
如果都 AI 时代了,我还需要采用在“手机键盘上费力打字”的方式做交互,这也太不 AI 了!
仅从「豆包」的 IP 形象,以及默认语音交互方式,就能看出字节在 AI 应用上的产品思考——从基因根子上就要采用 AI 的方式。
2)大模型能力出色当然,作为一款通用 AI 应用,最关键的还是它解决问题的能力,到底能不能帮助我们提高效率、辅助完成工作。
① “进阶版”搜索引擎在知识储备方面,「豆包」不仅上知天文下晓地理,还能随时随地获取全网资讯热点,你甚至可以把它当一个“进阶版”搜索引擎使用。
为什么是进阶版?
传统搜索引擎大家都非常熟悉,我们在搜索引擎里输入自己的问题,搜索引擎根据关键词从各处抓取链接,然后排序展示给你。如果没搜到,你还得绞尽脑汁重新优化自己的提问。
更讨厌的是,你根本不知道摆在你面前的是不是广告?是不是钓鱼贴?
在传统搜索方式里,只是找到客观、准确的非广告信息就能耗费你大量精力了。
那么在「豆包」里搜索,体验怎么样呢?
比如 618 快到了,我让「豆包」给我介绍一下各大电商平台都有什么玩法和政策?
输入问题后,它的回答速度非常快,先简练地将不同平台的政策、玩法分别用1句话总结,让我能够快速掌握不同平台的整体情况。
接着,他又非常贴心的将平台的具体玩法变化结构化呈现出来,时间、玩法、方式、特点条理清楚,扫一眼就能快速掌握信息,全程不超过 30 秒。
可上下滚动查看更多
「豆包」里搜索不仅获取信息全面高效,更重要的是信息还可靠可溯源,且自动排除各种广告和钓鱼贴的干扰。每一条所搜总结,它都会列出参考资料,如想了解更多,随时可以针对任何延伸问题进行追问。
如下图,当我追问“超级红包”具体的玩法后,「豆包」迅速给出答案——如何领取、如何分享、如何核销、会场玩法、其他玩法……全流程一个不落。
可上下滚动查看更多
再比如我问「豆包」一个相对开放的问题:最近亚当很火,发生什么了?
「豆包」的回答没有任何“车轱辘话”,简单直接的告诉我“因为他参加了《歌手 2024》”。在答案后,豆包还进一步介绍了下亚当的背景、风格等。
除此之外,我又对周鸿祎卖迈巴赫、庆余年 2 播出、菏泽树哥郭有才等多个热点事件进行了多轮测试,竟没有找出一处“大模型幻觉”问题。
可以说,「豆包」在语义理解、全网信息实时检索、信息筛选、文本输出能力已经非常靠谱了。
注:大模型幻觉是指:大语言模型在回答某些问题时,产生不准确、不完整甚至是虚假的误导性的输出。
② 工作、学习的提效利器作为通用 AI 工具,「豆包」在解决具体场景下的工作、学习问题的能力,也是非常强悍的。
比如我想了解中级经济师的报考,但我毫无经验,网上的信息又良莠不齐,此时将问题告诉「豆包」,它就非常精准的帮我总结了正确的报考资质、要求,甚至报名流程都给我准备好了。
不仅如此,从真题获取方式、到合理的备考时间安排,都给你安排的明明白白。
可上下滚动查看更多
甚至,你在智能体广场里,还能搜到专门的“中级经济师备考助手”“刷题助手”“考试督导老师”……该说不说,这都快赶上“私教”待遇了!
作为一名编辑,阅读各类行业报告是刚需,但有些报告又长有难度,不仅语言晦涩还专业名词巨多。
为了考验下「豆包」,我把刚到手的一篇近 90 页的超长报告《AI 行业大模型调研报告》发给「豆包」。
结果,「豆包」就像一位资深的行研编辑,将报告的框架、观点、要点、结论等结构化呈现出来,且内容非常详尽。
看完这段总结,你真的对这本报告的整体内容有的进一步了解,而不是很多“AI 工具”常出现的“读完仿佛什么也没读”的窘境。如下图,内容有点长,大家不妨看看完整的总结,真的很奈斯!
可上下滚动查看更多
更友好的是,你不仅可以针对报告的任何内容进行追问,报告之外的“发散问题”它也能很好的回答。
比如我先问“报告里 Agent 相关的内容”,接着追问“有无报告之外的,我需要了解的”,让「豆包」给我推荐相关书籍等等,都能非常顺畅地得到解答。
可上下滚动查看更多
事实上,不止是 PDF,Word、Excel 等各种常见文档都能直接上传。
想象一下,你在一个项目里收到了一大堆资料文件,领导第二天要做会议分享,你要在下班前完成会议 PPT。这时,如果你有一个高效工具帮你做信息整理,你的工作进度将会飞起。
这时候,更刺激的来了。你甚至还能更进一步,直接让「豆包」根据文档报告,给你生成一份 PPT 大纲!
从结果来看,它的逻辑还是相当顺畅的,核心结构完整,并且具体到每一页该讲什么内容,都能清晰罗列出来。
省下分析归纳的步骤后,我们可以将更多精力放在更重要的内容方面,只需顺着它的脉络填充,再套个好看的模版,一份新鲜的 PPT 就做好了。
可上下滚动查看更多
身为一名内容工作者,每篇新选题都需要深入了解一个行业、一个产业。有了「豆包」助力,效率提升不是一星半点。
比如我们想从专业的营销角度,来分析下新能源汽车。我可以直接让它生成一个行业报告。——“请你利用麦肯锡波特五力模型来分析一下新能源汽车行业,要足够专业,内容翔实,结构清晰”。
不到 10 秒钟,一个基于波特五力模型的行业框架就出来了。省去了大量收集素材、整合素材的时间,而且在实际体验中我发现,对「豆包」问得越细,它回答得就越专业、越具体,很多时候还能给我新的灵感和观点启发。
可以上下滚动查看更多
至于写个朋友圈、小红书文案、周报、讲稿、任务采访大纲等都毫无压力,甚至简单的视频脚本都能妥妥胜任。
可以说拯救广大“新媒体人”于水火的利器了。
③ 生活中的“随身哆啦a梦”至于生活类的场景,经测试我们几乎可以说:遇到什么不懂的事,只要问「豆包」,都能解决的七七八八。
比如周末在家买了皮皮虾,问问「豆包」:有什么好的做法?怎么剥皮?
「豆包」不仅回答了皮皮虾的做法、剥皮方法,还在底部配上对应的操作视频。
保姆级贴心体验!
大学同学要来上海玩,问我有什么推荐景点、美食的。身为死宅,几乎两眼一抹黑。
这时,把具体情况告诉「豆包」,立刻一份旅游攻略就被安排得明明白白。
不仅 Day1、Day2、Day3 景点排好,甚至旅游的动线都清楚地给你列出来……这可比自己做的攻略详细的多了!
可上下滚动查看更多
3)丰富度+可拓展性千万级用户量除了带来了热度,也带来了充足的智能体社区建设者,「豆包」智能体社区的丰富度、可拓展性都是国内大模型里顶级的。
在「豆包」APP 上,你可以像游戏里“捏角色”一样,通过「添加形象」「设定声音」「设定性格」等维度“捏一个自己的智能体”。
你甚至可以克隆自己的声音,订一个专属自己的智能体声音。操作也很简单,按照提示清晰的读一段话,就完成了。
我按照步骤,用自己声音捏了一个“讲冷笑话的小卡”。
但你别说,这克隆的效果还真不错。语音通话打过去,声音的音色稳定,对话流畅,尤其是听他“用我的声音给我讲冷笑话”,真的是格外有趣哈哈!
比如在「火山引擎原动力大会」上,就展示了一个小女孩自己制作了“学习小助手”智能体。
你只需要给问题拍一张照片,“学习小助手”就会针对你的学习问题给出解答。
据《火山引擎原动力大会》里的数据介绍,「豆包」的智能体总量已经达到 800W 个了,这个数字甚至超过了大部分大模型的 MAU(月活)了。
有趣、有用的 C端 玩法,来自海量尝试后的“涌现”。在绝对数量面前,「豆包」的智能体社区想不好玩都不行。
02国产AI大逃杀,字节豆包能笑到最后吗?从前面的测评中我们可以看到,AI 大模型的能力已经很强大了。
但我们都知道,这不是终点,甚至只是起步。
因为 AGI 底层技术还在快速迭代,AI 应用的竞争力并不只是建立在现在大模型能做什么,更建立在几个月后、几年后大模型能做到什么,以及企业在技术持续演进下优化、迭代产品的能力。
所以当我们试图对这场“国产 AI 大逃杀”做些预测和分析时,我们需要回到大模型更底层的能力维度上。
我将其总结为 AI 大模型的三根支柱:算力、数据、产品落地能力。
1)算力某种意义上,AGI 本质是:电+芯片=产出智能。算力就是 AI 时代的石油,就是大模型企业的核心竞争力。
而国内,拥有最丰富算力资源的企业就是——字节跳动。
据之前《晚点 LatePost》报道,字节2023年向英伟达订购了超过 10 亿美元的 GPU(约合 70 亿元人民币),到货和没到货的 A100 与 H800 总计有 10 万块。而 2022 年全年,英伟达数据中心 GPU 在中国的销售总额大约为 100 亿元,也就是说,仅字节一家公司2023年的订单可能已接近英伟达去年在中国销售的商用 GPU 总和。
事实上早在推出豆包之前,字节就已经成为了国内最大的 AI 算力供给方,包括智谱、百川、MiniMax、出门问问等众多热门大模型,用的都是字节端算力。
2023 年字节公布「火山方舟」首批大模型合作伙伴
2)数据在 2023 年,“大模型幻觉”经常被提及。
所谓“幻觉”指的就是,AI 生成的内容不准确、无意义,甚至瞎编乱造。
这就是典型的数据问题。因为大模型的核心原理,就是通过预测“下一个字符”概率来输出内容。
那么此时,关键是什么?
数据的质量、数据的数量、数据标注的准确的、多样性……
在「豆包」被推出之前,字节就拥有中国最大的内容池,其算法、数据的精细化程度都是最顶级的;在「豆包」被推出之后,字节又成为最多活跃用户使用的 AI 软件……
在数据维度层面,恐怕国内互联网大厂都无出其右。
3)产品落地能力关于字节的产品能力,其实不必过多赘述。细节处见产品力,而这在「豆包」产品交互体验部分已经有了充分的展示和印证。
并且,「豆包」一个孤立的应用,背后是字节新成立的一整个 AI 部门——Flow。
据国内媒体采访显示,除了 AI 原生应用外,抖音、头条、飞书部分功能都使用了大模型,比如抖音搜索、头条搜索结果就是用豆包大模型来生成。
看到这里我们会发现,豆包的竞争力其实并不偶然,而是字节在各方综合能力、优势的自然展现。
03结语当然,在现阶段国内大模型还在“做大蛋糕”的阶段。
大模型市场才刚刚开始,重要的是一起把大模型做好、把应用落地做好、把成本做低,让更多人和企业受益。
在我看来,「豆包」的出现正是国内 AI 应用告诉发展的提现。
未来,希望「豆包」越做越好用,也希望字节能做出越来越多像「豆包」这样,精良、流量、有产品思考的 AI 产品。
更多运营干货
「品牌对话」 | 诺特兰德 | 鸭鸭 | NOWWA 挪瓦咖啡 | 霸王茶姬 | 立白 | 全棉时代 | 花加 | 熊猫不走 | 唐久便利店 | 笑果文化 | 天虹 | 萨福 | 樊登读书 | 首尔丽格 | 水獭吨吨 | 全聚德 | Lemonbox | 蕉下 | 巡物社
「品牌观察」 | pidan | 名创优品 | 锅圈食汇 | 貂艺 | 库迪咖啡 | tea'stone | 达美乐 | 书亦烧仙草 | 蔚来 | 海底捞 | 茶颜悦色 | 瑞幸 | 亚朵酒店
「平台运营」微信 | 视频号 | 企业微信 | 抖音 | 快手 | 小红书 | 淘宝 | 支付宝 | B站 | 拼多多
「运营方法论」产品营销 | 内容方法论 | 投放营销 | 用户运营 | 店铺经营 | 直播电商 | 私域运营 | 出海运营 | AIGC