Meta下月發布開源Llama 3語言模型

Meta在一場公開活動上確認將在下個月內發布Llama 3,一個用於驅動生成式人工智能(AI)助理的下一代大型語言模型。

據科技媒體TechCrunch報道,Meta全球事務總裁克雷格(Nick Clegg)在倫敦一場活動上表示:「在接下來的一個月內,實際上可能更短,我們希望在非常短的時間內,推出下一代的新基礎模型套件Llama 3。」

他進一步稱「今年將推出許多具有不同功能和多樣性的不同型號,而且很快就會開始。」

Meta的首席產品長考克斯(Chris Cox)補充道,計劃透過Llama 3為Meta的多種產品提供支援。

Meta一直在努力追趕OpenAI,後者於一年多前推出聊天機器人ChatGPT,令谷歌等其他大型科技公司都大吃一驚,其迅速走紅使生成式AI問答變成了日常生活的主流體驗。

Meta基本上對AI開發採取非常謹慎的態度,先前版本的Llama遭到批評功能太過有限。實際上,Llama的首代版本從未對公眾發布,Llama 2則於2023年7月才公開發布。

Llama 3的規模比前幾代更大,預計將解決這個問題,不僅可以更準確地回答問題,還能解決更廣泛的問題,其中可能包括更具爭議性的主題。

Meta沒有透露Llama 3所使用的參數大小,也沒有提供任何有關其如何運作的演示。一般估計,它有大約1400億個參數,相比之下Llama 2模型只有700億個參數。

最值得注意的是,Meta的Llama系列是作為開源產品而構建,對於AI應如何作為一種普遍技術進行發展,這代表著一種不同的哲學作法。透過這樣做,Meta希望吸引更多的開發人員,而不是擁有更多的專利。本報訊

科技-三藩市版