Meta下月發布開源Llama 3語言模型

2024-04-11 05:58:00

Meta在一場公開活動上確認將在下個月內發布Llama 3，一個用於驅動生成式人工智能（AI）助理的下一代大型語言模型。

據科技媒體TechCrunch報道，Meta全球事務總裁克雷格（Nick Clegg）在倫敦一場活動上表示：「在接下來的一個月內，實際上可能更短，我們希望在非常短的時間內，推出下一代的新基礎模型套件Llama 3。」

他進一步稱「今年將推出許多具有不同功能和多樣性的不同型號，而且很快就會開始。」

Meta的首席產品長考克斯（Chris Cox）補充道，計劃透過Llama 3為Meta的多種產品提供支援。

Meta一直在努力追趕OpenAI，後者於一年多前推出聊天機器人ChatGPT，令谷歌等其他大型科技公司都大吃一驚，其迅速走紅使生成式AI問答變成了日常生活的主流體驗。

Meta基本上對AI開發採取非常謹慎的態度，先前版本的Llama遭到批評功能太過有限。實際上，Llama的首代版本從未對公眾發布，Llama 2則於2023年7月才公開發布。

Llama 3的規模比前幾代更大，預計將解決這個問題，不僅可以更準確地回答問題，還能解決更廣泛的問題，其中可能包括更具爭議性的主題。

Meta沒有透露Llama 3所使用的參數大小，也沒有提供任何有關其如何運作的演示。一般估計，它有大約1400億個參數，相比之下Llama 2模型只有700億個參數。

最值得注意的是，Meta的Llama系列是作為開源產品而構建，對於AI應如何作為一種普遍技術進行發展，這代表著一種不同的哲學作法。透過這樣做，Meta希望吸引更多的開發人員，而不是擁有更多的專利。本報訊

科技-三藩市版