玩酷网

英伟达新发布的号称超越了GPT-4o和Claude 3.5的Nemotron-7

英伟达新发布的号称超越了GPT-4o和Claude 3.5的Nemotron-70B模型,看了几个评测都认为夸大了不少。Harrison Kinsley的测试说其性能和Qwen2 72B差不多。Aider LLM Leaderboards(主要测试编码水平)的结果也是略差于Qwen2 72B。 Livebench AI 的结果也是分数比qwen2.5-72b-instruct还差不少。 ​​​