谷歌聊天機器人Gemini換代 性能大提升

谷歌發布Gemini 1.5 Pro。谷歌

谷歌15日發布了Gemini 1.5 Pro,宣稱性能比上一代模型「大幅提升」。

前一周,谷歌才發布了Gemini 1.0 Ultra,並將Bard聊天機器人更名為Gemini,以適應更強大、更多功能的新模型。

據Engadget報道,谷歌執行長皮查伊和谷歌DeepMind執行長哈薩比斯(Demis Hassabis)在公告博文中,一方面試圖向受眾保證AI的道德安全,另一方面宣傳新模型的快速進階功能。皮查伊總結說:「我們的團隊以安全為核心,不斷推動最新模型的發展。」

谷歌需要向對AI抱有懷疑的批評者和政府監管機構強調安全性,也需要向開發者、潛在客戶和投資人強調其模型正在加速的性能,因為他們擔心谷歌對OpenAI在ChatGPT上取得的突破性成功反應太慢。

皮查伊和哈薩比斯說,Gemini 1.5 Pro的結果與Gemini 1.0 Ultra相當,但執行效率更高,計算要求更低。多模態功能包括處理文本、圖像、視頻、音頻或代碼。隨著AI模型的發展,它們將在一個提示框中繼續提供更多功能。

Gemini 1.5 Pro可以處理多達100萬個token。谷歌表示,該模型可以處理超過70萬個單詞、1小時的視頻、11小時的音頻和超過3萬行代碼的代碼庫,並透露已經「成功測試」了一個支持多達1000萬個token的版本。

谷歌稱,該模型在「大海撈針」實驗評估中表現出色。谷歌表示,在測試中,Gemini 1.5 Pro 能在99%的情況下在長達100萬個token的數據塊中找到測試者嵌入的文本。

谷歌稱,Gemini 1.5 Pro可以推理402頁長的阿波羅11號登月任務紀錄中的各種細節,能分析上傳的的44分鐘無聲電影中的情節點和事件。哈薩比斯寫道:「由於1.5 Pro的長上下文窗口在大規模模型中尚屬首次,我們正在不斷開發新的評估和基準,以測試其新穎的功能。」

谷歌現在發布的Gemini 1.5 Pro可處理12.8萬個token,與OpenAI公開宣布的GPT-4模型的最大值相同。哈薩比斯說,谷歌最終將推出新的定價層級,支持多達100萬個token的查詢。

Gemini 1.5 Pro還善於從長提示信息中學習新技能,無需額外的「上下文學習」微調。在一項名為「從一本書開始的機器翻譯」的基準測試中,該模型從零開始學會了卡拉芒語(Kalamang)的語法手冊。

谷歌稱,Gemini 1.5 Pro在將英語翻譯成卡拉芒語時的學習表現與人類表現相近。

谷歌正在面向開發者和企業客戶推出Gemini 1.5早期體驗版。Gemini 1.0目前面向消費者推出,同時還有月費20元的Pro版。本報訊

科技-三藩市版