谷歌發布Gemini 3 推理功能大幅提升

/

/

谷歌Gemini 3功能強大,谷歌示範可將一個韓語家庭手寫食譜(左)照片的文字,經提示後轉為英文(中)和編列成圖文並茂的文件(右)。

谷歌發布最新且最先進的基礎模型Gemini 3,可透過Gemini程式和人工智能(AI)搜尋介面來使用。

與Gemini 2.5的發布僅相隔七個月,谷歌號稱新模型是其迄今為止功能最強的大型語言模型,成為市場上最強大的AI工具之一。此外,Gemini 3的發布距離OpenAI推出GPT 5.1不到一周,也離Anthropic發布Sonnet 4.5僅僅兩個月,再次凸顯前沿模型開發的驚人速度。

一個更偏向研究用途的進階版本,名為Gemini 3 Deepthink,在通過進一步的安全測試後,將在未來幾周提供給Google AI Ultra訂閱用戶使用。谷歌負責Gemini模型產品的主管多希(Tulsee Doshi)表示:「Gemini 3的推理能力實現了巨大的飛躍,它的回應深度和細膩程度,是我們前所未見的。」

此模型的部分推理能力已反映在獨立基準測試中。在用於衡量一般推理能力和專業知識的「人類的最後考試」(Humanity’s Last Exam)基準測試,Gemini 3以37.4分的成績寫下歷史新高。先前的最高分紀錄由GPT-5 Pro保持,為31.64分。Gemini 3也在LMArena排行榜上名列榜首,LMArena是一個由人類主導的基準測試,旨在衡量用戶滿意度。

谷歌表示,Gemini應用程式目前擁有超過6.5億月活躍用戶,有1300萬名軟體開發人員已將該模式整合入其工作流程中。

除了基礎模型之外,谷歌還發布一款由Gemini驅動的程式設計介面:Google Antigravity,可進行多畫面、具代理能力(agentic)的程式編寫,類似Warp或Cursor 2.0等具代理能力的整合開發環境(IDE)。Antigravity結合了類似ChatGPT的提示視窗、一個命令列介面(CLI),以及一個瀏覽器視窗,會顯示程式代理對程式碼進行變更後的效果。本報訊

科技-三藩市版