
Meta周三宣佈推出一款名為V-JEPA 2的新型AI「世界模型」,為去年發佈的V-JEPA模型擴展版本,可更有效地理解3D環境及實體物件的運動,為機械人與自動駕駛等技術開啟新時代。
能認知滾落的球將掉下來
公司表示,V-JEPA 2使用了來自多個來源、超過100萬小時影片和100萬張圖片進行訓練,同時也使用了機械人數據,使其能夠在物理世界中進行理解、預測和規劃,例如能夠認知到一顆從桌上滾落的球將會掉下來,或者一個被遮擋住的物體並非憑空消失。
公司又認為,V-JEPA 2應用於外賣機械人及自動駕駛汽車等機器上有很多優勢,因為他們需要即時理解周遭環境,才能在複雜的物理世界中安全並有效地行動。
稱速度較Nvidia模型快30倍
值得注意的是,Meta稱V-JEPA 2的速度比Nvidia的Cosmos模型快30倍,但Meta評估自家模型的基準可能與Nvidia所用的不同。Meta首席AI科學家Yann LeCun則表示,相信「世界模型」將為機械人技術開創一個新時代,讓現實世界中的AI智能體能夠在不需要天文數字般的機械人訓練數據的情況下,協助處理家務和體力任務。