
據內媒引述阿里雲通義千問指出,繼Qwen3-2507系列後,再推出迄今為止規模最大、能力最強的模型「Qwen3-Max」。
多項測試中達業界領先水平
目前Qwen3-Max-Instruct的預覽版在LMArena文本排行榜上位列第三,超越了GPT-5-Chat;正式版本在代碼能力和智能體(agent)能力方面亦進一步提升,在涵蓋知識、推理、編程、指令遵循、人類偏好對齊、智能體任務和多語言理解的全面基準測試中,均達到業界領先水平。
通義團隊表示,Qwen3-Max模型總參數超過1T,預訓練使用了36T tokens,模型結構沿用了Qwen3系列的模型結構設計範式,使用了通義提出的global-batch load balancing loss。
此外,仍在訓練中的Qwen3-Max-Thinking已展現出非凡潛力,在結合工具使用並增加測試時計算資源的情況下,該思考版本已在AIME 25、HMMT等高難度推理基準測試中取得100%的準確率,期待不久將來可向公眾正式發布新版本。