全新AI世界模型Genie 3 可即時生成互動3D環境

DeepMind推出最新AI「世界模型」Genie 3。DeepMind

谷歌DeepMind推出最新一代AI「世界模型」Genie 3,能即時生成用戶與AI代理均可互動的3D環境,並大幅延長世界的可遊玩時間。官方表示,這一版本將實現環境持久記憶,用戶即使視線離開再回望,物件仍會保持原狀。

The Verge報道指出,所謂「世界模型」,是一種可模擬各類環境的AI系統,應用於教育、娛樂及機械人訓練等領域。只需輸入提示詞,系統便能生成可供自由遊走的虛擬空間,完全由AI自動建構3D素材,無需手工設計。谷歌近年積極投入相關研究,12月發表的Genie 2已能根據圖片製作互動世界。

過往的世界模型仍存在多項限制,例如Genie 2生成的世界僅能遊玩約1分鐘。有測試過市面上由Pixar聯合創辦人投資的新創公司「互動影片」產品,反映其視覺效果如同模糊版谷歌街景,畫面隨移動畫面會出現異常變形。

Genie 3被視為重大進步。官方網誌介紹,新一代模型可依用戶提示生成可持續互動數分鐘的虛擬世界,遠超Genie 2僅能維持10至20秒互動的限制。Genie 3還能維持長達約1分鐘的視覺記憶,例如牆上的塗鴉或黑板上的字跡,轉身再回望仍會保留原來的位置。新版本畫面可達720p解像度,並以24fps畫格率運作。

此外,DeepMind還為Genie 3加入所謂「可提示世界事件」功能,僅需簡單輸入指令,即可變換天氣、加入新角色等,讓虛擬環境更加豐富和動態。本報訊

科技-三藩市版