Gemini Live善辨識音用戶互動更流暢

2025-08-22 05:58:00

Gemini Live將改善聊天機器人與用戶互動方式。谷歌

谷歌正在為這是一款可與使用者進行即時對話的人工智能（AI）助理Gemini Live帶來一系列新功能。從下周開始，Gemini Live將能在使用者共享相機時，直接在螢幕上標示內容，讓AI助理更容易指出特定項目。

例如，如果你正在為某個專案尋找合適的工具，可以將智能手機的相機對準一組工具，Gemini Live就會在螢幕上標示正確的那個。此功能將於8月28日隨著新發布的Pixel 10手機推出。谷歌也將同時開始向其他Android安卓裝置推出視覺引導功能，並在未來幾周擴展到iOS系統。

谷歌還將推出新的整合功能，允許Gemini Live與更多程式進行互動，包括訊息、電話和時鐘。假設你正在與Gemini討論前往目的地的路線，突然發現快遲到了，可以發指令打斷：「這條路線似乎不錯。現在幫我傳訊息給Alex，告訴他我大概會晚10分鐘。」Gemini就會幫你草擬要傳給朋友的簡訊。

谷歌也將為Gemini Live推出升級版的音訊模型，號稱將「顯著改善」聊天機器人「運用人類語音關鍵元素的能力，例如語調、節奏和音高」。不久後，Gemini就能夠依據對話主題改變語氣，例如在您詢問與壓力相關的主題時，會以比較平和的聲音回答。

你還將能夠調整Gemini的說話速度，這聽起來有點類似於用戶在ChatGPT語音模式中調整語氣風格。如果要求Gemini從某個角色或歷史人物的角度，以戲劇性的方式重述一個故事，Gemini可能會採用適當的口音，從而呈現「豐富且引人入勝」的敘述。本報訊

科技-三藩市版