阿里旗下通義千問推能力最強模型「Qwen3-Max」

2025-09-23 20:44:00

據內媒引述阿里雲通義千問指出，繼Qwen3-2507系列後，再推出迄今為止規模最大、能力最強的模型「Qwen3-Max」。

多項測試中達業界領先水平

目前Qwen3-Max-Instruct的預覽版在LMArena文本排行榜上位列第三，超越了GPT-5-Chat；正式版本在代碼能力和智能體（agent）能力方面亦進一步提升，在涵蓋知識、推理、編程、指令遵循、人類偏好對齊、智能體任務和多語言理解的全面基準測試中，均達到業界領先水平。

通義團隊表示，Qwen3-Max模型總參數超過1T，預訓練使用了36T tokens，模型結構沿用了Qwen3系列的模型結構設計範式，使用了通義提出的global-batch load balancing loss。

此外，仍在訓練中的Qwen3-Max-Thinking已展現出非凡潛力，在結合工具使用並增加測試時計算資源的情況下，該思考版本已在AIME 25、HMMT等高難度推理基準測試中取得100%的準確率，期待不久將來可向公眾正式發布新版本。