
據內媒報道,華為將於本周二(12日)於2025年金融AI推理應用落地與發展論壇上,發表AI推理領域的突破性技術成果,或能降低中國AI推理對HBM(高頻寬記憶體)技術的依賴,提升內地AI大模型推理性能,完善中國AI推理生態的關鍵部份。
解決「資料搬運」關鍵
報道引述業內人士指出,目前AI行業已從「追求模型能力的極限」轉向「追求應用價值的最大化」,因此推理成為AI下一階段的發展重心。至於HBM是解決「資料搬運」的關鍵,當HBM不足時,用戶使用AI推理的體驗會明顯下降,導致出現反應慢等問題。
報道又提到,來自信通院、清華大學和科大訊飛的專家,亦將在8月12日舉行的「2025金融AI推理應用落地與發展論壇」上,分享大模型推理加速與體驗優化的實踐。