DeepSeek據報用華為晶片訓練失敗 推遲發佈新模型

內地人工智能初創DeepSeek據報因使用華為晶片訓練失敗,因而推遲發佈新模型,反映中國晶片在關鍵任務上仍落後於美國競爭對手,凸顯中國在技術自給自足面臨的挑戰。

被鼓勵採用華為昇騰處理器

據英國《金融時報》引述消息報道,DeepSeek今年1月發佈R1模型後,被鼓勵採用華為的昇騰(Ascend)處理器,而非使用Nvidia的晶片來訓練AI模型。然而,DeepSeek使用昇騰晶片訓練R2模型過程中遇到技術問題,促使其改用Nvidia晶片作訓練,用華為晶片作推理。

事實上,DeepSeek-R2大模型原定5月推出,其後再傳計劃於8月15日至30日期間發布,但最終未有落實日子。
 

即時財經