微信聊天框内置元宝，超级App又一轮进化开始

头图来源：视觉中国

微信终于在聊天框放了个AI助手。

虽然名称上还是「元宝红包封面助手」，但在介绍里可以看到其是依托于腾讯混元大模型的AI服务，可以提供陪聊、答题、作图以及定制红包封面等功能。

微信作为国内最大的社交平台，这次内置AI助手元宝或许意味着AI技术正在从独立功能向基础设施转变，腾讯正在将微信的生态优势转化到AI领域。

这会是腾讯重回AI牌桌的绝杀开端吗？

实测，用AI更丝滑了

极客公园做了一番简单实测。先是问了一下它和元宝app的异同有哪些：

然后我丢入一篇极客公园昨天发布的公众号文章链接，内容是关于DeepSeek 发布 V3 模型更新，「元宝红包封面助手」回复说「收到，我问问元宝～」，这个回复有点人性化的。

随后它也没问我是否需要开启深度思考，就直接进行了21秒的深度思考：

元宝的深度思考过程｜图片来源：极客公园

然后给出了我一份分析：

DeepSeek公司于2024年3月24日发布了V3模型的重要更新，该版本虽非预期的V4或R2迭代，但在性能表现和开源政策上实现了显著突破。以下是本次更新的核心要点：

该更新标志着DeepSeek在保持成本优势的同时，通过技术迭代缩小了与顶尖闭源模型的差距，特别是在编程领域展现出颠覆性潜力，其开源策略调整或将重塑大模型生态格局。

技术规格与发布信息模型参数规模达6850亿，属于小版本升级（V3-0324）基于全新32K GPU集群进行后训练优化已通过官网、App及小程序等多渠道开放使用开源版本同步上线，延续初代V3"557.6万美元成本比肩Claude3.5"的高性价比特性核心能力提升编程能力跨越式突破前端开发能力接近Claude3.7专家级水平，用户测试显示：能生成包含CSS动画与JavaScript交互的完整HTML文件（如天气卡片动态效果）代码质量显著优于旧版R1模型（对比案例显示视觉效果与功能实现差距明显）在网站搭建测试中生成效果与Claude3.7 Sonnet相当支持复杂指令解析（如通过函数/按钮组实现多天气动画切换）多模态理解增强上下文理解能力提升，尤其在多轮对话场景可精准处理跨语言混合编程需求（示例未展示但文中暗示）开源生态建设采用更宽松的开源协议，降低商业应用限制延续初代V3作为首个冲入Chatbot Arena榜单前十开源模型的优势发布1小时内即吸引全球开发者参与测试验证行业影响与用户反馈被专业用户评价为"相当于Claude Sonnet3.5到3.6的升级幅度" 在无官方基准测试情况下，用户实测数据成为主要验证依据开发者社区高度关注其开源协议调整带来的商业化可能性未来展望官方未透露V4/R2研发进展，但用户期待值持续升温当前版本已确立开源大模型领域新标杆，可能加剧行业竞争眼看清明节就要到了，我也问了问它「清明节做点什么好」，对这个问题它倒是没回复「收到，去问元宝」，也没开启深度思考模式，而是很快就输出了答案：清明节，作为中国传统节日之一，不仅是缅怀先人、寄托哀思的时刻，也是亲近自然、感受春天气息的好机会。以下是一些清明节期间可以进行的活动建议：无论选择哪种方式，重要的是要用心感受节日的意义，珍惜与家人朋友相处的时光，同时也要注意安全和环保，让清明节成为一个有意义且愉快的假期。祭扫祖先：前往祖坟或陵园，清扫墓地，献上鲜花、纸钱等，表达对逝去亲人的怀念和敬意。踏青赏春：利用清明假期，与家人朋友一同外出踏青，欣赏春天的美景，呼吸新鲜空气，放松心情。植树造林：参与植树活动，为大地增添一抹新绿，既是对自然的回馈，也是对生命的礼赞。品尝清明食品：制作或购买清明节特有的食品，如青团、清明果等，体验传统节日的风味。文化体验：参观博物馆、文化遗址，了解清明节的历史文化背景，增长知识。家庭聚会：利用假期与家人团聚，共叙亲情，享受家庭的温馨。静思冥想：在宁静的环境中，进行冥想或静思，反思生活，规划未来。公益活动：参与社区或慈善机构组织的公益活动，帮助需要帮助的人，传递正能量。户外运动：进行徒步、骑行、野餐等户外活动，锻炼身体，享受户外的乐趣。摄影创作：带上相机，捕捉春天的美丽瞬间，进行摄影创作，记录生活的美好。还有分析文件的功能我也试了一下，之前如果看到比较复杂的文件想让AI先帮忙概括总结一下要点再去细读的话，得先去打开AI产品或者去相应的网页，但现在可以直接在微信里丢给这个助手，使用体验更丝滑了一些。这次「元宝红包封面助手」也自行开启了深度思考模式：

在21秒的深度思考后，助手给出了出一份分析：对文档内容的技术分析与行业洞察一、语言模型技术演进核心突破：从N-gram到Transformer的范式转变，语言模型参数量级从百万级（GPT-1）跃升至万亿级（GPT-4）自监督学习（MLM/NSP）解决了海量数据标注难题，预训练+微调模式成为行业标准词嵌入维度从768（BERT）扩展到12888（GPT-3），语义表征能力呈指数级提升关键技术指标：训练数据量：GPT-3使用45TB数据（约1万亿词），相当于1351万本牛津词典算力成本：ChatGPT训练需1万张V100 GPU，成本超10亿人民币模型效率：DeepSeek通过稀疏注意力等技术，将训练成本降低至同规模模型的1/3 二、Transformer架构创新技术革命性：自注意力机制实现O(n²)的全局关联建模，相比RNN的序列依赖突破显著多头注意力层数从12层（BERT）增至96层（GPT-3），上下文窗口从512扩展到32K（Llama2）位置编码从绝对位置（Sinusoidal）发展到相对位置（RoPE），更好处理长序列工程实践突破：混合精度训练（FP16/FP32）节省40%显存消耗梯度检查点技术（Gradient Checkpointing）实现百倍序列长度扩展张量并行+流水线并行将千亿参数模型训练效率提升80% 三、DeepSeek的技术突破开源生态贡献：模型架构：提出动态稀疏注意力机制，推理速度较Llama提升2.3倍训练效率：MoE架构实现万亿参数模型在千卡集群上的可行训练中文优化：构建包含2.6万亿token的中英双语预训练语料库性能指标对比：数学推理：DeepSeek-Math-7B在GSM8K达到83.5%准确率（GPT-4为92%）代码生成：HumanEval得分68.9%（CodeLlama-34B为53.7%）多模态理解：ViT-22B在ImageNet-21K上top-1准确率达88.7% 四、行业发展趋势技术前沿方向：多模态融合：GPT-4o实现200ms级跨模态响应延迟（人类平均反应时间250ms）推理能力突破：DeepSeek-V3在定理证明任务上达到IMO金牌选手水平能源效率：新型混合架构（如DeepSeek-R1）实现每瓦特算力提升5倍中美竞争格局：开源模型差距从12个月缩短至3个月（Llama3 vs DeepSeek-v2）算力基建：中国在建智算中心规划算力达2000EFLOPS（美国当前运营1200EFLOPS）行业应用渗透率：中国制造业AI质检部署率达37%，超越美国29% 五、关键数据启示经济学视角：大模型训练边际成本曲线：参数规模每提升10倍，单位token训练成本下降28% ROI周期：头部企业模型商业化回报周期从36个月缩短至18个月人才密度：顶尖AI研究员中美薪资差距从50%收窄至15% 技术伦理考量：安全对齐：最新RLHF技术将有害输出概率从3.2%降至0.07% 能耗优化：液冷集群PUE值从1.5优化至1.08，碳排放减少40% 可解释性：因果归因算法实现85%的决策路径可视化注：文中涉及企业及技术参数均来自公开资料，分析基于技术演进规律推导，具体实施需结合行业动态调整。建议关注浙江大学CCAI中心官网获取最新研究成果。看来关于是否开启深度思考模式，「元宝红包封面助手」有自己的判断，如果任务很简单，就不开启，反之自动开启。加速AI布局过去一个月，腾讯在AI应用领域加速布局。 2月起，腾讯旗下多个核心产品，如微信、元宝、QQ浏览器、QQ音乐、ima（腾讯智能工作台）、腾讯文档、腾讯地图等，均接入了DeepSeek模型，并同步支持自研的混元大模型；元宝走向日更级迭代，35天版本更新30次；混元大模型推出腾讯首个自研推理模型混元深度思考模型Thinker(T1)、发布新一代快思考模型TurboS、推出5个全新3D生成模型并全部开源…… 业务线也作出整合，为了更好地发挥AI技术的协同效应，2月，腾讯将QQ浏览器、搜狗输入法、ima等十余款AI产品及团队从PCG（平台与内容事业群）划归CSIG（云与智慧产业事业群），形成以“元宝”为核心的“C端工具+B端服务”矩阵。在资金投入上，腾讯也展现了其在AI基础设施建设上的决心。在1月的2024年度员工大会上，马化腾提到腾讯会持续投入资源进行算力的储备。据报道，腾讯计划在2025年加大算力基础设施的投资，投资金额或达1000亿，其中计算约580亿（GPU约400亿、服务器约110亿、存储设备约55亿、网络设备将近58亿），IDC部分，自建及相关费用加起来将近131亿，租用部分将近要花200亿。3月19日，腾讯总裁刘炽平在财报后的电话会议上称，资本支出占收入的百分比将上升到十几个百分点，人工智能将成为战略投资的重点。微信这次将大模型产品“元宝”内嵌于聊天界面，看似是功能升级，实则是腾讯对AI时代的战略卡位。通过将大模型产品以「AI版文件传输助手」形态嵌入高频聊天场景，微信将用户的工作流、信息流统一收束，通过总结公众号文章、解析文件、图片等刚需功能，微信在原有的功能之外，新增了一个可以持续产生价值的AI助手角色，这可能会让用户在微信的停留时长和打开频次迎来结构性增长。微信作为国内最大的社交平台，这次内置AI助手元宝或许意味着中国互联网正式进入“AI原生应用”时代，AI技术正在从独立功能向基础设施转变。而随着开源日渐成为行业趋势，单纯的大模型技术能力越来越难以成为产品和市场竞争的绝对壁垒。当微信这样的庞大生态，带着海量用户接入 AI 功能，对于所有的 AI 创业者来说可能都要思考：到底什么样的功能和创新，可以让小公司与微信这样的生态竞争用户接触 AI 的入口；到底什么样的壁垒，才能不被现有的超级产品生态，以接入新功能的方式吞噬。 DeepSeek 重塑了 AI 行业的格局，技术公司、大厂和 AI 原生创业者，都要重新思考自己的生态位。

玩酷网

微信聊天框内置元宝，超级App又一轮进化开始

极客公园