阿里旗下通義千問推能力最強模型「Qwen3-Max」

據內媒引述阿里雲通義千問指出,繼Qwen3-2507系列後,再推出迄今為止規模最大、能力最強的模型「Qwen3-Max」。

多項測試中達業界領先水平

目前Qwen3-Max-Instruct的預覽版在LMArena文本排行榜上位列第三,超越了GPT-5-Chat;正式版本在代碼能力和智能體(agent)能力方面亦進一步提升,在涵蓋知識、推理、編程、指令遵循、人類偏好對齊、智能體任務和多語言理解的全面基準測試中,均達到業界領先水平。

通義團隊表示,Qwen3-Max模型總參數超過1T,預訓練使用了36T tokens,模型結構沿用了Qwen3系列的模型結構設計範式,使用了通義提出的global-batch load balancing loss。

此外,仍在訓練中的Qwen3-Max-Thinking已展現出非凡潛力,在結合工具使用並增加測試時計算資源的情況下,該思考版本已在AIME 25、HMMT等高難度推理基準測試中取得100%的準確率,期待不久將來可向公眾正式發布新版本。

即時財經