阿里推Qwen3升級版性能超過Kimi-K2及DeepSeek-V3等

2025-07-21 19:11:00

阿里巴巴（9988）旗下通義千問表示，推出Qwen3升級版模型「Qwen3-235B-A22B-Instruct-2507-FP8」，亦是非思考模式（Non-thinking）的更新版本。目前已在魔搭社區和HuggingFace上開源更新。

通用能力顯著提升

根據介紹，新Qwen3模型的通用能力顯著提升，包括指令遵循、邏輯推理、文本理解、數學、科學、編程及工具使用等方面，在GQPA（知識）、AIME25（數學）、LiveCodeBench（編程）、Arena-Hard（人類偏好對齊）及BFCL（Agent能力）等眾多測評中表現出色，超過Kimi-K2、DeepSeek-V3等頂級開源模型，以及Claude-Opus4-Non-thinking等領先閉源模型。

此外，該模型還增強了部份關鍵性能，包括在多語言的長尾知識覆蓋方面，模型取得顯著進步；在主觀及開放性任務中，模型顯著增強了對用戶偏好的契合能力，能夠提供更有用的回覆，生成更高質量的文本；以及長文本提升到256K，上下文理解能力進一步增強。

阿里推Qwen3升級版性能超過Kimi-K2及DeepSeek-V3等

通用能力顯著提升

最新⽂章

即時財經

京東首推外賣自營店「七鮮小廚」擬3年增至萬店設小型炒菜機

滙豐流動理財推4大新功能盼更多存摺戶口客戶轉用

領展CEO王國龍宣佈退休！回顧工作哽咽落淚：「呢個真係香港成功故事」

自住？Yes！投資？No！｜曾智華

「大而美」料增逾26萬億財赤美國會預算辦公室：千萬人將失醫保

Hibor普遍升 1個月拆息升至近0.93厘

Trump Media累購20億美元比特幣及相關證券

阿里旗下高德地圖7月在港用量增逾30% 推200元優惠券助的士拓客源

德銀稱特朗普一旦罷免鮑威爾 30年期美債息或飆逾50基點

港股步入超買區惟未見大幅下調壓力｜古天后

阿里推Qwen3升級版 性能超過Kimi-K2及DeepSeek-V3等

通用能力顯著提升

最新⽂章

即時財經

阿里推Qwen3升級版性能超過Kimi-K2及DeepSeek-V3等