开源Qwen一周连刷三冠实测Qwen最强推理模型
卷疯了,通义千问真的卷疯了。
Qwen3-Coder刚炸完场,就隔了一天,马上全新开源Qwen3系列最强推理模型——Qwen3-235B-A22B-Thinking-2507。
关键是,就在这短短一周里,算上前两天开源的新基础模型Qwen3-235B-A22B-Instruct-2507(非思考版),和Qwen3-Coder,通义千问是完成了一波开源三连。
官方表示,新推理模型主要提升了3方面的核心能力:
- 逻辑推理、数学、科学和编码等任务上性能显著提升;
- 能更好地遵循指令、使用工具、生成文本;
- 支持256K原生上下文,适用于高度复杂的推理任务。
开源还不算,各个出手即SOTA:接连斩获基础模型、编程模型、推理模型三项全球开源最强。
我们也简单测试了一下Qwen3-235B-A22B-Thinking-2507。
还是那道经典题:7米长的甘蔗如何通过2米高1米宽的门?
Qwen3-235B-A22B-Thinking-2507思考了43秒,最后给出的答案是:【图3】
思考过程如下:【图4】
相较之下,o4-mini的答案就简单粗暴了些。【图5】
看来这个模型更新强度和效能提升,妥妥地引领全球了。
就问小扎慌不慌(doge)