
據傳,為降低對HBM芯片的依賴,華為在AI推理領域已經取得突破性技術成果,並將在12日的「2025金融AI推理應用落地與發展論壇」上發表。
綜合《中國基金報》、IT之家等媒體報道,華為即將發布的成果或能降低中國AI推理對HBM的技術依賴,提升中國AI大模型推理性能,完善中國AI推理生態的關鍵部分。
業內人士指出,AI行業目前已從「追求模型能力的極限」轉向「追求應用價值的最大化」,因此推理成為AI下一階段的發展重心。HBM是解決「數據搬運」的關鍵,當HBM不足時,用戶使用AI推理的體驗會明顯下降,導致出現反應慢等問題。
今年3月,北京大學聯合華為發布DeepSeek全端開源推理方案,該方案基於北大自研SCOW算力平台系統和鶴思調度系統,整合DeepSeek、openEuler、MindSpore等社區開源模組,實現華為昇騰上的DeepSeek高效推理。
算力和存儲將決定未來十年AI勝負的關鍵,但從技術與產品成熟度來看,中國HBM較海外產品有較大技術差距。在這種情況下,「彎道超車」是更好的選擇。
華為執行長任正非6月曾指出,華為單就芯片還是落後美國一代,但華為用數學補物理、非摩爾補摩爾,用軟件計算補足,在結果上也能達到實用狀況。他續指,在疊加和集群等方法下,計算結果上與最先進水平是相當的。