全球首个混合推理模型Claude3.7推出，最强编程工具同步问世

上周，号称最聪明的Grok 3刚发布，这周DeepSeek连续开源5天，OpenAI GPT-4.5也喊着就要上线了，再加上今天Claude 3.7 Sonnet推出，大模型领域的混战不断升级。

Anthropic推出了其首款“混合推理模型”Claude 3.7 Sonnet，集成快速响应与扩展思考模式，用户可通过API精确控制模型思考时长（最长128K tokens）。它能够解决更复杂的问题，数学和编程能力提高10%以上。Anthropic还发布了其“自主性”编程工具Claude Code预览版，其表示能够使开发人员直接从终端将重要的工程任务委托给Claude。

在多项基准测试中，扩展思考模式加持下的Claude 3.7 Sonnet，在数学、物理、指令执行、编程等方面刷新SOTA。与o3-mini、DeepSeek R1相比，除了数学，带有扩展思考模式的Claude 3.7 Sonnet拿下最高分。

尤其在编程能力方面，Claude 3.7 Sonnet处于领先地位，在SWE-bench上创下了70.3%的高分。

自2024年6月以来，Sonnet一直是全球开发者的首选模型。今天推出的首款自主性编程工具Claude Code，是一个积极的合作者，能够搜索和阅读代码、编辑文件、编写和运行测试、将代码提交到GitHub，并使用命令行工具。

歌剧组都是真的 3

2025-02-25 18:17

deepseek开源后，什么阿猫阿狗都出来喊大哥大了
大柒 2

2025-02-25 17:31

CPU够用就好再快的用来切菜也是🔪
黑猫少女软软 1

2025-02-25 18:21

deepseek现在是标杆了
希望 1

2025-02-25 21:41

短短两个月，deepseek已经成为行业标杆了，不管哪家的llm做出点成绩，都要拿来跟deepseek对比一下
寻觅

2025-02-26 19:00

deepseek厉害的不是他的能力，而是他的训练成本[呲牙笑]
不要逼我想昵称

2025-02-25 18:57

每个人都说超越 deepseek[捂脸哭]
97年空巢老人?

2025-02-26 02:00

3.5 也比 r1 好用 r1 我只是用来处理一些中文创作性上的东西用的最多的 ai 还是 gork3 和claude
紫微斗数

2025-02-26 01:16

chatgpt火的时候每更新或发布一个ai就说能超chatgptdeepseek火的时候每更新或发布一个ai就说能超deepseek
滚蛋蛋

2025-02-25 23:54

现在ai都要对标ds了吗行业苹果[无奈吐舌]

玩酷网

全球首个混合推理模型Claude3.7推出，最强编程工具同步问世

科技有点奇谱