玩酷网

阿里云发布Qwen3-Max 总参数超1T

上证报中国证券网讯(记者孙小程)9月24日,阿里云推出Qwen3-Max,这是该公司迄今为止规模最大、能力最强的模型。

Qwen3-Max模型总参数超过1T,预训练使用了36Ttokens。模型结构沿用Qwen3系列的设计范式,使用阿里云提出的global-batchloadbalancingloss。

据介绍,目前,Qwen3-Max-Instruct的预览版在LMArena文本排行榜上位列第三,超越GPT-5-Chat。正式版本在代码能力和智能体(agent)能力方面进一步提升,在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中均达到业界领先水平。