玩酷网

评估大模型编程能力的Aider更新了他们的基准测试排行，DeepSeek R1+

2025-01-25 10:15:43 蚁工厂科技

评估大模型编程能力的Aider更新了他们的基准测试排行，DeepSeek R1+ Sonnet组合现在是第一。

其中R1是架构师模型（ Architect），Sonnet是编辑者模型（Editor ）

• 架构师模型：负责提出编码问题解决方案

• 编辑者模型：根据架构师的方案生成具体代码编辑指令，并应用于现有源码文件

而且这一组合的成本比第二的o1方案要低很多。另外o1+Sonnet的方案不如o1单独的方案。

阅读：0 点赞：0