玩酷网

评估大模型编程能力的Aider更新了他们的基准测试排行,DeepSeek R1+

评估大模型编程能力的Aider更新了他们的基准测试排行,DeepSeek R1+ Sonnet组合现在是第一。

其中R1是架构师模型( Architect),Sonnet是编辑者模型(Editor )

• 架构师模型:负责提出编码问题解决方案

• 编辑者模型:根据架构师的方案生成具体代码编辑指令,并应用于现有源码文件

而且这一组合的成本比第二的o1方案要低很多。另外o1+Sonnet的方案不如o1单独的方案。