谷歌聊天機器人Gemini換代性能大提升

2024-02-17 05:58:00

谷歌發布Gemini 1.5 Pro。谷歌

谷歌15日發布了Gemini 1.5 Pro，宣稱性能比上一代模型「大幅提升」。

前一周，谷歌才發布了Gemini 1.0 Ultra，並將Bard聊天機器人更名為Gemini，以適應更強大、更多功能的新模型。

據Engadget報道，谷歌執行長皮查伊和谷歌DeepMind執行長哈薩比斯（Demis Hassabis）在公告博文中，一方面試圖向受眾保證AI的道德安全，另一方面宣傳新模型的快速進階功能。皮查伊總結說：「我們的團隊以安全為核心，不斷推動最新模型的發展。」

谷歌需要向對AI抱有懷疑的批評者和政府監管機構強調安全性，也需要向開發者、潛在客戶和投資人強調其模型正在加速的性能，因為他們擔心谷歌對OpenAI在ChatGPT上取得的突破性成功反應太慢。

皮查伊和哈薩比斯說，Gemini 1.5 Pro的結果與Gemini 1.0 Ultra相當，但執行效率更高，計算要求更低。多模態功能包括處理文本、圖像、視頻、音頻或代碼。隨著AI模型的發展，它們將在一個提示框中繼續提供更多功能。

Gemini 1.5 Pro可以處理多達100萬個token。谷歌表示，該模型可以處理超過70萬個單詞、1小時的視頻、11小時的音頻和超過3萬行代碼的代碼庫，並透露已經「成功測試」了一個支持多達1000萬個token的版本。

谷歌稱，該模型在「大海撈針」實驗評估中表現出色。谷歌表示，在測試中，Gemini 1.5 Pro 能在99%的情況下在長達100萬個token的數據塊中找到測試者嵌入的文本。

谷歌稱，Gemini 1.5 Pro可以推理402頁長的阿波羅11號登月任務紀錄中的各種細節，能分析上傳的的44分鐘無聲電影中的情節點和事件。哈薩比斯寫道：「由於1.5 Pro的長上下文窗口在大規模模型中尚屬首次，我們正在不斷開發新的評估和基準，以測試其新穎的功能。」

谷歌現在發布的Gemini 1.5 Pro可處理12.8萬個token，與OpenAI公開宣布的GPT-4模型的最大值相同。哈薩比斯說，谷歌最終將推出新的定價層級，支持多達100萬個token的查詢。

Gemini 1.5 Pro還善於從長提示信息中學習新技能，無需額外的「上下文學習」微調。在一項名為「從一本書開始的機器翻譯」的基準測試中，該模型從零開始學會了卡拉芒語(Kalamang)的語法手冊。

谷歌稱，Gemini 1.5 Pro在將英語翻譯成卡拉芒語時的學習表現與人類表現相近。

谷歌正在面向開發者和企業客戶推出Gemini 1.5早期體驗版。Gemini 1.0目前面向消費者推出，同時還有月費20元的Pro版。本報訊

科技-三藩市版