上周,号称最聪明的Grok 3刚发布,这周DeepSeek连续开源5天,OpenAI GPT-4.5也喊着就要上线了,再加上今天Claude 3.7 Sonnet推出,大模型领域的混战不断升级。

Anthropic推出了其首款“混合推理模型”Claude 3.7 Sonnet,集成快速响应与扩展思考模式,用户可通过API精确控制模型思考时长(最长128K tokens)。它能够解决更复杂的问题,数学和编程能力提高10%以上。Anthropic还发布了其“自主性”编程工具Claude Code预览版,其表示能够使开发人员直接从终端将重要的工程任务委托给Claude。

在多项基准测试中,扩展思考模式加持下的Claude 3.7 Sonnet,在数学、物理、指令执行、编程等方面刷新SOTA。与o3-mini、DeepSeek R1相比,除了数学,带有扩展思考模式的Claude 3.7 Sonnet拿下最高分。

尤其在编程能力方面,Claude 3.7 Sonnet处于领先地位,在SWE-bench上创下了70.3%的高分。

自2024年6月以来,Sonnet一直是全球开发者的首选模型。今天推出的首款自主性编程工具Claude Code,是一个积极的合作者,能够搜索和阅读代码、编辑文件、编写和运行测试、将代码提交到GitHub,并使用命令行工具。
deepseek开源后,什么阿猫阿狗都出来喊大哥大了
CPU够用就好 再快的用来切菜也是🔪
deepseek现在是标杆了
短短两个月,deepseek已经成为行业标杆了,不管哪家的llm做出点成绩,都要拿来跟deepseek对比一下
deepseek厉害的不是他的能力,而是他的训练成本[呲牙笑]
每个人都说超越 deepseek[捂脸哭]
3.5 也比 r1 好用 r1 我只是用来处理一些中文创作性上的东西 用的最多的 ai 还是 gork3 和claude
chatgpt火的时候每更新或发布一个ai就说能超chatgptdeepseek火的时候每更新或发布一个ai就说能超deepseek
现在ai都要对标ds了吗 行业苹果[无奈吐舌]